多选题 对于 MapTask 其中阶段,说法正确的是:

A、 Read阶段:MapTask通过用户编写的RecordReader,从输入InputSplit中解析出一个个key/value。
B、 Map阶段:该节点主要是将解析出的key/value交给用户编写map()函数处理,并产生一系列新的key/value
C、 Collect收集阶段:在用户编写map()函数中,当数据处理完成后,一般会调用OutputCollector.collect()输出结果。在该函数内部,它会将生成的key/value分区(调用Partitioner),并写入一个环形内存缓冲区中。
D、 Spill阶段:即“溢写”,当环形缓冲区满后,MapReduce会将数据写到本地磁盘上,生成一个临时文件。需要注意的是,将数据写入本地磁盘之前,先要对数据进行一次本地排序,并在必要时对数据进行合并、压缩等操作。
下载APP答题
由4l***05提供 分享 举报 纠错

相关试题

多选题 对于 HDFS 读写流程说法正确的是?

A、

数据节点会组织一个管道,管道的目的时最小化从客户端到最后一个数据节点的总网络距离。

B、

当数据被写入 HDFS 文件后,数据能被新的读客户端看到。

C、

hflus刷新操作首先立即将当前数据包推送到管道中,然后等待管道中的数据节点确认数据包传输成功。

D、

当客户端打开要读取的文件时,它从名字节点获取块列表和每个块副本的位置。

单选题 spill 过程发生在 MapReduce 程序的哪一端?

A、map端
B、reducer端
C、两端都会发生
D、两端都不会发生

单选题 不属于计算虚拟化的技术有 ()

A、CPU虚拟化
B、内存虚拟化
C、存储虚拟化
D、IO虚拟化

多选题 虚拟化技术能够实现以下哪些设备的虚拟化? ()

A、CPU
B、内存
C、存储
D、网络

单选题 分区是发生在 spill 之前还是之后

A、
B、

单选题 虚拟化技术主要是对什么东西进行虚拟化?

A、软件
B、硬件
C、系统

单选题 当数据达到环形缓冲区的多大时,mapreduce 会将环形缓冲区的数据进行排序,然后溢写磁盘。

A、90%
B、70%
C、80%
D、100%

判断题 计算虚拟化是将物理机的硬件资源进行虚拟化形成的资源池。

A、正确
B、错误