单选题 Spark中Application Master的主要作用是?
A、协调整个集群的资源分配
B、管理单个应用的任务执行和资源申请
C、存储RDD的元数据信息
D、执行具体的计算任务
单选题 Spark中用于将RDD数据持久化到内存的算子是?
A、cache
B、map
C、reduce
D、collect
单选题 Hive中LOAD DATA命令如果省略LOCAL关键字,数据来源是?
A、本地文件系统
B、HDFS文件系统
C、FTP服务器
D、关系型数据库
单选题 下列哪个算子属于Spark的宽依赖(Wide Dependency)?
A、map
B、filter
C、groupByKey
D、join(无shuffle)
单选题 Hive中用于实现排名功能的聚合函数是?
A、concat
B、substr
C、rank
D、upper
单选题 下列关于Hive外部表的描述中,正确的是?
A、删除外部表会同时删除HDFS数据
B、外部表的元数据与数据存储分离
C、外部表适合存储临时数据
D、外部表不能创建分区
单选题 Hive创建分桶表的关键字是?
A、PARTITIONED BY
B、CLUSTERED BY
C、BUCKETED BY
D、GROUPED BY
单选题 Spark Standalone模式中,负责管理单个节点资源的组件是?
A、Driver
B、Worker
C、Cluster Manager
D、Executor