使用当前浏览器访问考试宝,无法享受最佳体验,推荐使用 Chrome 浏览器进行访问。
更新时间: 试题数量: 购买人数: 提供作者:
有效期: 个月
章节介绍: 共有个章节
我的错题 (0道)
我的收藏 (0道)
我的斩题 (0道)
我的笔记 (0道)
顺序练习 0 / 0
随机练习 自定义设置练习量
题型乱序 按导入顺序练习
模拟考试 仿真模拟
题型练习 按题型分类练习
易错题 精选高频易错题
学习资料 考试学习相关信息
通过反射机制推断Schema实现RDD转换DataFrame时,不需要定义一个case class样例类。
1分
Apache Hive是Spark上的SQL引擎,也是大数据系统中重要的数据仓库工具。
启动Kafka服务需要依赖Zookeeper服务,因此启动Kafka服务前首先启动Zookeeper集群。
Scala的元组是对多个同类型对象的一种简单封装,它将不同的值用小括号括起来,并用逗号作分隔,即表示元组。
Scala中的Trait可以对定义的字段和方法进行实现,Java中的接口也可以。
Spark SQL与Hive相互不兼容。
Spark2.0之后,Spark使用全新的SparkContext接口替代SQLContext及HiveContext接口完成数据的加载、转换、处理等功能。
在Scala中,集合有三大类分别是List、Set以及Map。
部署Spark高可用集群不需要用到Zookeeper服务。
Spark计算框架在处理数据时,所有的中间数据都保存在磁盘中。
Spark SQL不仅能够查询MySQL数据库中的数据,还可以向表中插入新的数据。
Spark不支持在各种集群管理器(Cluster Manager)上运行。
Kafka集群部署依赖于Java环境和Zookeeper服务,因此在安装Kafka集群时,需要首先配置JDK环境和Zookeeper服务。
行动算子主要是将在数据集上运行计算后的数值返回到驱动程序,从而触发真正的计算。
Worker Node为执行器的工作单元。
Scala提供了重量级的语法用于定义匿名函数,支持高阶函数,允许嵌套多层函数,并支持柯里化。
在数据科学应用中,数据工程师可以利用Spark进行数据分析与建模。
DataFrame提供了两种语法风格,即DSL风格语法和SQL风格语法。
Spark SQL为Spark框架在结构化数据分析方面提供重要技术支持。