相关试题
单选题 【单选题】 (2分)
Map端的Shuffle过程包括4个步骤,分别是输⼊数据和执⾏Map任务;( );溢写;⽂件归并。
单选题 【单选题】 (2分)
计算URL访问频率:map函数处理web⻚⾯请求的记录,输出(URL,1)。reduce函数把相同URL的value都加起来,产⽣⼀个?( )
单选题 【单选题】 (2分)
各个reduce也各⾃并⾏计算,各⾃负责处理不同的中间结果数据集合,进⾏reduce处理之前,必须等到所有的map函数_____,因此,在进⼊reduce前需要
有⼀个阶段负责对map的中间结果数据进⾏_____处理,以便reduce更有效地计算最终结果, 最终汇总所有reduce的输出结果即可获得最终结果。
()
单选题 【单选题】 (2分)
Google在2004年发表了⼀篇⽂章阐述了MapReduce分布式编程思想,名字是( )
单选题 【单选题】 (2分)
⽤户编写的MapReduce程序通过什么提交到JobTracker端的( )
单选题 【单选题】 (2分)
两个键值对<“a”,1>和<“a”,1>,如果合并,会得到什么?( )
单选题 【单选题】 (2分)
若不针对MapReduce编程模型中的key和value值进⾏特别设置,下列哪⼀项是MapReduce不适宜的运算。( )
单选题 【单选题】 (2分)
各个map函数对所划分的数据( )处理,从不同的输⼊数据产⽣不同的中间结果输出。