单选题 ()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。
A、深层页面爬虫
B、增量式网络爬虫
C、聚焦网络爬虫
D、通用网络爬虫
单选题 Python语言中用来定义函数的关键字是()
A、function
B、def
C、fun
D、define
单选题 数据采集是数据分析前的重要且首要环节,数据采集需要符合哪些特性()
A、多维性、灵活性、高延迟
B、全面性、多维性、高效性
C、低维度、高并发、高速率
D、单一化、低维度、低并发
单选题 “ab”+”c”*2结果是:()
A、abc2
B、abcabc
C、abcc
D、ababcc
单选题 ()是进行数据清洗的工具。
A、logstash
B、tomcat
C、apache
D、filebeat
单选题 在Logstash的bin目录下启动Logstash的命令是()
A、logstash
B、logstash-c../config/a.conf
C、logstash-f../config/a.conf
D、logstash-e../config/a.conf
单选题 logstash默认端口号为()。
A、8089
B、5044
C、8080
D、7070
单选题 Logstash的INPUT数据输入配置中用于开发人员进行测试的方式是哪一种
A、stdin
B、file
C、kafka
D、filebeat