单选题 Spark的执行模型是基于什么结构的?
A、树形结构
B、环形结构
C、有向无环图(DA
D、线性结构
单选题 Spark的核心模块是哪一个?
A、Spark SQL
B、Spark Core
C、MLlib
D、GraphX
单选题 RDD在Spark中代表什么?
A、弹性分布式数据集
B、随机数据生成器
C、数据缓存机制
D、数据序列化工具
单选题 在Spark DataFrame API中,用于过滤数据的函数是:
A、select
B、filter
C、show
D、count
单选题 在GraphX中,如何计算源顶点ID大于目标顶点ID的边的数量?
A、val count = grap
B、edges.filter
C、=>
D、srcI
E、>
F、dstI
G、count()
H、val count = grap
单选题 Spark与MapReduce相比,在处理速度上更快的主要原因是:
A、Spark使用内存计算
B、Spark支持更多类型的操作
C、Spark有更先进的DAG调度器
D、所有上述选项都是正确的
单选题 在Scala中,以下哪个关键字用于定义一个值不可变的变量?
A、var
B、val
C、let
D、const
单选题 以下哪个操作用于将两个RDD根据键进行连接?
A、rdd1.join(rdd2)
B、rdd1.union(rdd2)
C、rdd1.intersection(rdd2)
D、rdd1.cartesian(rdd2)