单选题 在Hadoop集群中,实现分布式存储的组件是()。
A、MapReduc
B、B.YARN
C、HDFS
D、Zookeeper
单选题 ()是一个交互式笔记本,支持运行40多种编程语言
A、PySpark
B、JupyterNotebook
C、Anacond
D、D.Pycharm
单选题 并不是所有企业都能自己产生数据,从而用于决策辅助,而更多的互联网企
业如电商等大部分是要靠()来抓取互联网数据进行分析。
A、Spark
B、Hadoop
C、python
D、爬虫
单选题 下列选项中属于Spark的特点的是()。
A、运行速度慢
B、容易使用
C、运行模式单一
D、不通用
单选题 Spark中用于执行SQL查询的接口是()。
A、SQLContext
B、HiveContext
C、SparkSession
D、DataFrameReader
单选题 下列选项中是开发Spark自身框架的语言是()。
A、Java
B、Scala
C、C++
D、Python
单选题 下列选项中是大数据4V特征的是()。
A、数据量小
B、数据类型单一
C、处理速度慢
D、价值密度低