单选题 MapReduce中,Shuffle操作的作用是()。
单选题 为了降低MapReduce两个阶段之间的数据传递量,一般采用()函数对map阶段的输出进行处理。
A、sort()
B、combiner()
C、join()
D、gather()
单选题 下列关于MapReduce说法不正确的是()。
A、MapReduce是一种计算框架
B、MapReduce来源于google的学术论文
C、MapReduce程序只能用java语言编写
D、MapReduce隐藏了并行计算的细节,方便使用
单选题 下列哪种业务场景中,不能直接使用Reducer充当Combiner使用()
A、sum求和
B、max求最大值
C、count求计数
D、avg求平均
单选题 在MapReduce中,通常将Map拆分成M个片段、Reduce拆分成R个片段,下面描述中错误的是()。
A、MapReduced中单台机器上执行大量不同的任务可以提高集群的负载均衡能力
B、Master必须执行O(M+R)次调度
C、Master在内存中保存O(M+R)个状态
D、M和R要比集群中Worker数量多
单选题 MapReduce计算框架的输入数据结构是()。
A、key-value
B、input-output
C、map-reduce
D、key-column
单选题 在MapReduce中,reduce()函数可以将()值相同的输入进行合并处理。
A、input
B、key
C、value
D、number
单选题 解决Master故障的方法是设置检查点,当Master失效时,从()检查点开始启动另一个Master进程。
A、第一个
B、中间一个
C、最后一个
D、随机选择一个