填空题 在Spark MLlib中,________是机器学习流程的基本抽象,它允许用户将多个数据处理步骤组合成一个工作流程,而________是Pipeline中的一个步骤。
相关试题
单选题 关于RDD的描述,正确的是_________。( )
单选题 Spark SQL中,_________操作会触发实际计算。( )
判断题 在Spark的YARN模式下,NodeManager负责管理每个任务的资源分配。
单选题 RDD的持久化级别不包括_________。( )
判断题 Spark的DAGScheduler负责将DAG分解为Stage,TASKScheduler负责将Stage分解为Task。
单选题 在Spark MLlib中,_________算法不能处理分类任务。( )
单选题 _________是Spark相比Hadoop的主要优势。( )
单选题 在Spark集群中,_________进程负责向集群管理器申请资源。( )