单选题 在数据采集过程中,面对庞大无序的网络数据,需要采用( )技术进行处理。

A、 直接拷贝
B、 网络爬虫
C、 下载
D、 FTP
下载APP答题
由4l***r0提供 分享 举报 纠错

相关试题

单选题 下列选项中,不属于不完整数据出现的原因的是( )。

A、某些属性由于涉及个人隐私而无法获取
B、机器故障产生了不完整数据
C、由于记录疏漏产生的数据不完整
D、命名约定或所用的数据代码不一致

单选题 如果从网络服务器收到的页面是空白的,缺少信息,或遇到其他不符合你预期的情况,有可能是因为网站创建页面的( )存在问题。

A、POST命令
B、IP地址
C、JavaScript执行
D、饼干

单选题 我们常将数据分为四个等级,其中( )结构最弱,数据只按名称分类。

A、定类等级
B、定序等级
C、定距等级
D、定比等级

单选题 评估特征工程首先要做的是( )。

A、在应用之前得到机器学习模型的基准性能
B、应用一种或多种特征工程
C、对于每种特征工程,获取一个性能指标
D、在机器学习流水线上应用

单选题 数据预处理的目的不包括( )。

A、改进数据质量
B、提高数据挖掘过程的效率
C、提高数据挖掘过程的准确性
D、提高数据采集的速度

单选题 下列选项中,违反了数据采集道德规范的是( )。

A、利用网络爬虫获取网站用户信息时屏蔽个人姓名
B、利用网络爬虫获取网站用户信息时用编号代替个人姓名
C、遇到警告时立刻停止采集
D、从未经许可的网站上自动收集客户名称、地址等个人信息

单选题 数据分析的首要任务是( )。

A、确认数据是结构化还是非结构化
B、确认数据是定量数据还是定性数据
C、进行数据可视化
D、进行描述性统计

单选题 ( )主要用于阻止爬虫自动提交表单。

A、隐含字段
B、隐含用户名
C、隐含地址
D、隐含代码