单选题 在下列Spark支持的文件格式中,哪一个不具备结构化?( )

A、 JSON
B、 CSV
C、 SequenceFiles
D、 文本文件
下载APP答题
由4l***mp提供 分享 举报 纠错

相关试题

单选题 下列选项中,哪个不属于Spark项目中的组件? ( )

A、 HDFS
B、 Spark
C、 MLib
D、 Spark

单选题 在进行针对一个RDD的转化操作中,下列哪个方法应用于RDD中的每个元素,并将返回值构成新的RDD?( )

A、 flatMap()
B、 map()
C、 filter()
D、 distinct()

单选题 RDD操作可分为转化操作和行动操作。下列操作方法中,哪个属于行动操作?( )

A、 map()
B、 countByValue()
C、 distinct()
D、 filter()

单选题 在分布式Spark应用中,包含哪些组件? ( )

A、 驱动器节点、执行器节点、累加器
B、 驱动器节点、累加器、集群管理器
C、 执行器节点、累加器、集群管理器
D、 驱动器节点、执行器节点、集群管理器

单选题 在下列Pair RDD的转化操作中,哪一个方法用于合并具有相同键的值?( )

A、 reduceByKey()
B、 groupByKey()
C、 mapValues()
D、 sortByKey()

单选题 在进行针对两个RDD的转化操作中,下列哪一个方法是生成一个包含两个RDD中所有元素?( )

A、 union()
B、 intersection()
C、 subtract()
D、 cartesian()

单选题 在下列持久化级别中,哪一个级别空间利用最大?( )

A、 MEMORY_ONLY
B、 MEMORY_AND_DISK_SER
C、 MEMORY_ONLY_SER
D、 DISK_ONLY

单选题 下列选项中,哪一个不属于Spark适用的分布式平台场景?( )

A、 批处理
B、 流处理
C、 迭代查询
D、 交互式查询