多选题 关于现阶段大数据技术体系,说法正确的是()。

A、 基础设施提供数据计算、数据存储、数据加工(Data Wrangling 或 Data Munging)等服务
B、 流处理、统计工具、日志分析都属于常用的开源工具
C、 数据资源代表的是生成数据的机构
D、 数据源与APP为数据科学和大数据产业生态系统提供数据内容
下载APP答题
由4l***r3提供 分享 举报 纠错

相关试题

多选题 传统关系数据库的优点包括()。

A、数据一致性高
B、数据冗余度低
C、简单处理效率高
D、产品成熟度高

多选题 算法“歧视”现象可能出现在()。

A、算法设计
B、算法实现
C、算法投入使用
D、算法验证

单选题 在数据科学中,通常可以采用()方法有效避免数据加工和数据备份的偏见。

A、A/B测试
B、训练集和测试集的划分
C、测试集和验证集的划分
D、图灵测试

多选题 Analytics1.0的主要特点有()。

A、分析活动滞后于数据的生成
B、重视结构化数据的分析
C、以对历史数据的理解为主要目的
D、注重描述性分析

单选题 ()是指几组不同的数据中均存在一种趋势,但当这些数据组组合在一起后,这种趋势消失或反转。

A、辛普森悖论
B、大数据悖论
C、大数据偏见
D、幸存者偏差

多选题 大数据处理流程可以概括为以下哪几步()。

A、数据分析与挖掘
B、数据采集
C、数据储存
D、结果展示

多选题 “以数据为中心”是数据产品区别于其他类型产品的本质特征,表现在()方面。

A、数据驱动
B、数据密集型
C、数据范式
D、数据可视化

单选题 HBase中KeyValue数据的存储格式是()。

A、HFile
B、HLogFile
C、SequenceFile
D、TXT