单选题 二级索引为 HBase 提供了按照某些列的值进行索引的能力。二级索引先查索引
表, 再定位到数据表中的位置, 不用全表扫描, 时延小。( ) [单选题]
相关试题
单选题 Channel 的作用类似队列, 用于临时缓存进来的数据, 当 Sink 成功地将数据发
送到下一跳的 Channel 或最终目的, 数据会从 Channel 移除。( ) [单选题]
单选题 大数据体量的不断增加,对数据存储的物理安全性要求越来越高,对数据的多副本与容灾机制也提出更高的要求。( ) [单选题]
单选题 Flume 的数据流可以根据 headers 的信息发送到不同的 Channel 中。( ) [单选题]
单选题 Elastic Search 的 shards 索引分片可以把索引数据打散分布到不同的节点。( )
[单选题]
单选题 Flink 是一个批处理和流处理结合的统一计算框架, 其核心是一个数据分发以及 并行化计算的流数据处理引擎。( ) [单选题]
单选题 在 Map Reduce 编程中, 业务逻辑一般需要自行写代码实现 mapper 和 reducer。
( ) [单选题]
单选题 HiveServer 将用户提交的 HL 语句进行编译, 解析成对应的 Yarn 任务、Spak 任
务或者 HDFS 操作, 从而完成数据的提取、转换、分析。( ) [单选题]
单选题 Spak Streaming 容错机制是指 RDD 中任意的 Partition 出错, 都可以根据其父
RDD 重新计算生成, 如果父 RDD 丢失, 则需要去磁盘中查找原始数据。( ) [单
选题]