多选题 【多选题】 (5分)
MapReduce执⾏的全过程包括以下哪⼏个主要阶段?( )

A、 从分布式⽂件系统读⼊数据
B、 执⾏Map任务输出中间结果
C、 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
D、 执⾏Reduce任务得到最终结果并写⼊分布式⽂件系统
下载APP答题
由4l***rx提供 分享 举报 纠错

相关试题

单选题 【单选题】 (2分)
若不针对MapReduce编程模型中的key和value值进⾏特别设置,下列哪⼀项是MapReduce不适宜的运算。( )

A、 Max
B、 Min
C、 Count
D、 Average

单选题 【单选题】 (2分)
各个reduce也各⾃并⾏计算,各⾃负责处理不同的中间结果数据集合,进⾏reduce处理之前,必须等到所有的map函数_____,因此,在进⼊reduce前需要
有⼀个阶段负责对map的中间结果数据进⾏_____处理,以便reduce更有效地计算最终结果, 最终汇总所有reduce的输出结果即可获得最终结果。
()

A、 开始,shuffle
B、 结束, shuffle
C、 shuffle,结束
D、 结束,combine

单选题 【单选题】 (2分)
计算URL访问频率:map函数处理web⻚⾯请求的记录,输出(URL,1)。reduce函数把相同URL的value都加起来,产⽣⼀个?( )

A、 (记录总数,URL)
B、 (URL,记录总数)
C、 (URL,1)
D、 (key,value)

单选题 【单选题】 (2分)
各个map函数对所划分的数据( )处理,从不同的输⼊数据产⽣不同的中间结果输出。

A、 并⾏
B、 串⾏
C、 集中
D、 分散

单选题 【单选题】 (2分)
两个键值对<“a”,1>和<“a”,1>,如果合并,会得到什么?( )

A、 <“a”,1,1>
B、 <“a”,<1,1>>
C、 <“a”,1,“a”,1>>
D、 <“a”,2>

单选题 【单选题】 (2分)
⽤户编写的MapReduce程序通过什么提交到JobTracker端的( )

A、 Client
B、 Jobtracker
C、 Task
D、 Tasktracker

单选题 【单选题】 (2分)
Map端的Shuffle过程包括4个步骤,分别是输⼊数据和执⾏Map任务;( );溢写;⽂件归并。

A、 排序合并
B、 写⼊缓冲区
C、 读出缓冲区
D、 分区

单选题 【单选题】 (2分)
Google在2004年发表了⼀篇⽂章阐述了MapReduce分布式编程思想,名字是( )

A、 MapReduce: Simplified Data Processing on Large Clusters
B、 MapReduce: Simplified Data Processing on PC
C、 MapReduce and HDFS
D、 Hadoop and MapReduce