单选题 数据采集的技术有许多种,下列选项中不是采集技术的是(  )

A、 Sqoop 采集技术
B、 Flume 采集技术
C、 网络爬虫技术
D、 MapReduce 处理技术
下载APP答题
由4l***1z提供 分享 举报 纠错

相关试题

单选题 Apache Spark 核心组件包含: Spark Streaming 、 Spark SQL 、 Spark Core 、 GraphX 、 MLlib, 下列哪个选项是对 MLib 组件的描述? (  )

A、提供流计算组件
B、是一个用来处理结构化数据的 Spark 组件
C、基于内存多语言执行的核心引擎
D、Spark 机器学习库

单选题 大数据计算服务 MaxCompute 是阿里巴巴自主研发的海量数据处理平台,主要服务于批 量结构化数据的存储和计算。以下不适合使用大数据计算服务实现的场景是 ?(  )

A、订单办理
B、数据仓库
C、社交网络分析
D、用户画像

单选题 下列数据库属于图数据库的是(  )。

A、Redis
B、GraphDB
C、MongoDB
D、Cassandra

单选题 分类算法是把每一条记录归到对应的类别之中,以下哪个不属于分类算法应用的场景 ? (  )

A、分析用户是否会购买电脑
B、分析用户是否会点击弹出的广告
C、分析收到的邮件是否为垃圾邮件
D、根据新输入父母的身高来分析其孩子的身高

单选题 使用 odpscmd 连接到 MaxCompute 中的某个 project 后 ,执行什么命令可以查看表 table_b 占用空间的大小。(  )

A、desc table_b;
B、size table_b;
C、select size from table_b;
D、show table table_b;

单选题 采用分布式的方式存储数据时,要考虑数据复制时一致性的问题,关于一致性如何保证 可以采取多种基本原则和设计理念,不包括哪项。(  )

A、LRU
B、CAP
C、ACID
D、BASE

单选题 在 MapReduce 处理过程中,每次计算都要从磁盘读取数据完成计算后又写入磁盘。这 体现了 MapReduce 的哪个缺点?(  )

A、不擅长实时计算
B、磁盘 IO 开销大
C、延迟高
D、中间结果多

单选题 MaxCompute 项目空间 A设置了项目空间保护 : set ProjectProtection=true; 并且将项目空 间 B设置为可信空间 : add trustedproject B; 无其他任何设置。以下说法中正确的是哪项? (  )

A、项目空间 A中的数据可以流至项目空间 B
B、项目空间 B中的数据可以流至项目空间 A
C、项目空间 A和项目空间 B中的数据可双向流动
D、项目空间 B中的数据只可以流至项目空间 A