单选题 【单选题】 (2分)
Google在2004年发表了⼀篇⽂章阐述了MapReduce分布式编程思想,名字是( )

A、 MapReduce: Simplified Data Processing on Large Clusters
B、 MapReduce: Simplified Data Processing on PC
C、 MapReduce and HDFS
D、 Hadoop and MapReduce
下载APP答题
由4l***rx提供 分享 举报 纠错

相关试题

单选题 【单选题】 (2分)
Map端的Shuffle过程包括4个步骤,分别是输⼊数据和执⾏Map任务;( );溢写;⽂件归并。

A、 排序合并
B、 写⼊缓冲区
C、 读出缓冲区
D、 分区

单选题 【单选题】 (2分)
两个键值对<“a”,1>和<“a”,1>,如果合并,会得到什么?( )

A、 <“a”,1,1>
B、 <“a”,<1,1>>
C、 <“a”,1,“a”,1>>
D、 <“a”,2>

单选题 【单选题】 (2分)
计算URL访问频率:map函数处理web⻚⾯请求的记录,输出(URL,1)。reduce函数把相同URL的value都加起来,产⽣⼀个?( )

A、 (记录总数,URL)
B、 (URL,记录总数)
C、 (URL,1)
D、 (key,value)

单选题 【单选题】 (2分)
⽤户编写的MapReduce程序通过什么提交到JobTracker端的( )

A、 Client
B、 Jobtracker
C、 Task
D、 Tasktracker

单选题 【单选题】 (2分)
各个map函数对所划分的数据( )处理,从不同的输⼊数据产⽣不同的中间结果输出。

A、 并⾏
B、 串⾏
C、 集中
D、 分散

单选题 【单选题】 (2分)
若不针对MapReduce编程模型中的key和value值进⾏特别设置,下列哪⼀项是MapReduce不适宜的运算。( )

A、 Max
B、 Min
C、 Count
D、 Average

单选题 【单选题】 (2分)
各个reduce也各⾃并⾏计算,各⾃负责处理不同的中间结果数据集合,进⾏reduce处理之前,必须等到所有的map函数_____,因此,在进⼊reduce前需要
有⼀个阶段负责对map的中间结果数据进⾏_____处理,以便reduce更有效地计算最终结果, 最终汇总所有reduce的输出结果即可获得最终结果。
()

A、 开始,shuffle
B、 结束, shuffle
C、 shuffle,结束
D、 结束,combine

单选题 【单选题】 (2分)
下列说法有误的是?( )

A、 Hadoop MapReduce是MapReduce的开源实现
B、 MapReduce⾮共享式,容错性好
C、 MapReduce可批处理、实时计算、数据疏散型
D、 MapReduce采⽤“ 分⽽治之”策略