单选题 Spark和MapReduce都是大数据计算框架。下列关于二者描述错误的是()。

A、 MapReduce产生的中间结果都要存储在本地磁盘上
B、 MapReduce可以胜任实时快速计算的要求
C、 Spark产生的中间结构存储在内存上
D、 Spark提供了多种数据集的操作类型
下载APP答题
由4l***mr提供 分享 举报 纠错

相关试题

单选题 现有两个Pair RDD,分别为rdd = {(1, 2), (3, 4), (3, 6)}和other = {(3, 9)}),执行rdd.subtractByKey(other) 的结果是什么?

A、 {(1, 2)}
B、 {(3, (4, 9)), (3, (6, 9))}
C、 {(1,([2],[])), (3, ([4, 6],[9]))}
D、 {(1, 2), (3, (4, 9)), (3, (6, 9))}

单选题 在进行针对两个RDD的转化操作中,下列哪一个方法是生成一个包含两个RDD中所有元素?

A、 union()
B、 intersection()
C、 subtract()
D、 cartesian()

单选题 在下列Spark支持的文件格式中,哪一个不具备结构化?

A、 JSON
B、 CSV
C、 SequenceFiles
D、 文本文件

单选题 在进行针对一个RDD的转化操作中,下列哪个方法应用于RDD中的每个元素,并将返回值构成新的RDD?

A、 flatMap()
B、 map()
C、 filter()
D、 distinct()

单选题 在下列持久化级别中,哪一个级别空间利用最大?

A、 MEMORY_ONLY
B、 MEMORY_AND_DISK_SER
C、 MEMORY_ONLY_SER
D、 DISK_ONLY

单选题 在下列Pair RDD的转化操作中,哪一个方法用于合并具有相同键的值?

A、 reduceByKey()
B、 groupByKey()
C、 mapValues()
D、 sortByKey()

单选题 下列选项中,哪一个不属于Spark适用的分布式平台场景?

A、 批处理
B、 流处理
C、 迭代查询
D、 交互式查询

单选题 在shell启动时会自动创建一个叫做sc的变量,该变量属于什么对象?

A、 Spark对象
B、 SparkSession对象
C、 SparkShell对象
D、 SparkContext对象