使用当前浏览器访问考试宝,无法享受最佳体验,推荐使用 Chrome 浏览器进行访问。
更新时间: 试题数量: 购买人数: 提供作者:
有效期: 个月
章节介绍: 共有个章节
我的错题 (0道)
我的收藏 (0道)
我的斩题 (0道)
我的笔记 (0道)
顺序练习 0 / 0
随机练习 自定义设置练习量
题型乱序 按导入顺序练习
模拟考试 仿真模拟
题型练习 按题型分类练习
易错题 精选高频易错题
学习资料 考试学习相关信息
如下命令启动Flume:> cd c:\apache-flume-1.9.0-bin> .\bin\flume-ng.cmd --conf ./conf --conf-file ./conf/kafka.conf --name a1 -property flume.root.logger=INFO,console
在kafka安装目录中启动Kafka服务:. \bin\windows\ .\config\
通过urllib.request模块实现发送GET请求获取网页内容:>>> import urllib.request>>> response=urllib.request. ("http://www.baidu.com")>>> html=>>> print(html)
HDFS采用了 结构模型,一个HDFS集群包括 和 。
数据清洗主要是对 、 、 和 进行处理。
计算机系统中的数据组织形式主要有两种,即 和 。
是构成信息的基本单位。
Hadoop包括三种安装模式 、 以及 。
是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成部分。
典型的数据分析过程包括 、 、 、 等。
数据清洗按照实现方式,可以分为____和____。
删除HDFS中/user/text.txt文件的命令是_______。
Hadoop包括三种安装模式____;____;____。
在爬取网页的时候,输出的信息中有时候会出现“抱歉,无法访问”等字眼,这就是禁止爬取,需要通过定制_____来解决。
BeautifulSoup 中,Tag对象或BeautifulSoup对象的________方法,可以使用CSS选择器的语法找到标签。
在Scrapy中,_______是用于定义如何从一个或多个网站抓取数据的类。
____是作业项之间带箭头的连接线,它定义了作业的执行路径。
每个Kettle作业由一个或多个____和连接作业项的____组成。
Kettle 的基本功能包括____管理和____管理。