单选题 在进行针对两个RDD的转化操作中,下列哪一个方法是生成一个包含两个RDD中所有元素?( )
A、 union()
B、 intersection()
C、 subtract()
D、 cartesian()
单选题 在下列持久化级别中,哪一个级别空间利用最大?( )
A、 MEMORY_ONLY
B、 MEMORY_AND_DISK_SER
C、 MEMORY_ONLY_SER
D、 DISK_ONLY
单选题 在下列Pair RDD的转化操作中,哪一个方法用于合并具有相同键的值?( )
A、 reduceByKey()
B、 groupByKey()
C、 mapValues()
D、 sortByKey()
单选题 下列选项中,哪个不属于Spark项目中的组件? ( )
A、 HDFS
B、 Spark
C、 MLib
D、 Spark
单选题 在下列Spark支持的文件格式中,哪一个不具备结构化?( )
A、 JSON
B、 CSV
C、 SequenceFiles
D、 文本文件
单选题 在分布式Spark应用中,包含哪些组件? ( )
A、 驱动器节点、执行器节点、累加器
B、 驱动器节点、累加器、集群管理器
C、 执行器节点、累加器、集群管理器
D、 驱动器节点、执行器节点、集群管理器
单选题 下列选项中,哪一个不属于Spark适用的分布式平台场景?( )
A、 批处理
B、 流处理
C、 迭代查询
D、 交互式查询
单选题 RDD操作可分为转化操作和行动操作。下列操作方法中,哪个属于行动操作?( )
A、 map()
B、 countByValue()
C、 distinct()
D、 filter()