Spark和MapReduce都是大数据计算框架。下列关于二者描述错误的

单选题 Spark和MapReduce都是大数据计算框架。下列关于二者描述错误的是（）。

A、 MapReduce产生的中间结果都要存储在本地磁盘上

B、 MapReduce可以胜任实时快速计算的要求

C、 Spark产生的中间结构存储在内存上

D、 Spark提供了多种数据集的操作类型

查看答案

下载APP答题

由4l***mr提供分享举报纠错

相关试题

单选题现有两个Pair RDD，分别为rdd = {(1, 2), (3, 4), (3, 6)}和other = {(3, 9)}），执行rdd.subtractByKey(other) 的结果是什么？

A、 {(1, 2)}

B、 {(3, (4, 9)), (3, (6, 9))}

C、 {(1,([2],[])), (3, ([4, 6],[9]))}

D、 {(1, 2), (3, (4, 9)), (3, (6, 9))}

查看答案

单选题在进行针对两个RDD的转化操作中，下列哪一个方法是生成一个包含两个RDD中所有元素？

A、 union()

B、 intersection()

C、 subtract()

D、 cartesian()

查看答案

单选题在下列Spark支持的文件格式中，哪一个不具备结构化？

A、 JSON

B、 CSV

C、 SequenceFiles

D、文本文件

查看答案

单选题在进行针对一个RDD的转化操作中，下列哪个方法应用于RDD中的每个元素，并将返回值构成新的RDD？

A、 flatMap()

B、 map()

C、 filter()

D、 distinct()

查看答案

单选题在下列持久化级别中，哪一个级别空间利用最大？

A、 MEMORY_ONLY

B、 MEMORY_AND_DISK_SER

C、 MEMORY_ONLY_SER

D、 DISK_ONLY

查看答案

单选题在下列Pair RDD的转化操作中，哪一个方法用于合并具有相同键的值？

A、 reduceByKey()

B、 groupByKey()

C、 mapValues()

D、 sortByKey()

查看答案

单选题下列选项中，哪一个不属于Spark适用的分布式平台场景？

A、批处理

B、流处理

C、迭代查询

D、交互式查询

查看答案

单选题在shell启动时会自动创建一个叫做sc的变量，该变量属于什么对象？

A、 Spark对象

B、 SparkSession对象

C、 SparkShell对象

D、 SparkContext对象

查看答案