判断题 DataSet是弱类型的,而DataFrame是强类型的。

A、 正确
B、 错误
下载APP答题
由4l***z0提供 分享 举报 纠错

相关试题

单选题 关于RDD的描述,正确的是_________。(  )

A、RDD是一个可变的分布式数据集合
B、RDD支持两种类型的操作:转换操作和行动操作
C、RDD不可以被持久化到磁盘
D、RDD是Spark中唯一的数据抽象

单选题 Spark SQL中,_________操作会触发实际计算。(  )

A、select("name")
B、ds.filter(col("age") > 18
C、ds.orderby()
D、

df.show()

判断题 在Spark的YARN模式下,NodeManager负责管理每个任务的资源分配。

A、正确
B、错误

单选题 RDD的持久化级别不包括_________。(  )

A、MEMORY_ONLY
B、CPU_ONLY
C、MEMORY_AND_DISK
D、DISK_ONLY

单选题 在Spark MLlib中,_________算法不能处理分类任务。(  )

A、

逻辑回归(LogistiRegression)

B、

决策树(Decision Tree)

C、

K-均值聚类(K-Means Clustering)

D、D.随机森林(Random Forest)

单选题 _________是Spark相比Hadoop的主要优势。(  )

A、更强大的存储能力
B、更快的计算速度
C、更高的数据安全性
D、更低的硬件成本

单选题 在Spark集群中,_________进程负责向集群管理器申请资源。(  )

A、Driver
B、Executor
C、Master
D、Worker

判断题 Spark的DAGScheduler负责将DAG分解为Stage,TASKScheduler负责将Stage分解为Task。

A、正确
B、错误