大数据存储（期末_在线真题试卷与模拟练习_大数据存储（期末_考试宝

更新时间：试题数量：购买人数：提供作者：

有效期：个月

章节介绍：共有个章节

收藏

我的练习

我的错题
(0道)

我的收藏
(0道)

我的斩题
(0道)

我的笔记
(0道)

专项练习

顺序练习 0 / 0

随机练习 自定义设置练习量

题型乱序 按导入顺序练习

模拟考试 仿真模拟

题型练习 按题型分类练习

易错题 精选高频易错题

学习资料 考试学习相关信息

搜索

题库预览

·CAP定理中CP表示一致性和分区保护性 13·NoSQL数据库主要支持BASE事务（BA基本可用性、S软状态、E最终一致性）

·文档数据库无须预先定义固定的模式

·关系数据库中的表和列族数据库中的列族对应

·cypher是Neo4j的图形化查询语言

·图数据库的数据模型：图结构

·列族数据库确定一个值：通过RowKey-CF-Column-Version来找到Vlaue

·云存储的目的是将数据和文件的副本保存为备份

·图数据库适合网络社交、欺诈检测、推荐引擎、知识图谱等场景应用。

·列族数据库与关系数据库的表格相似。

·列族数据库和文档数据库均不需预先定义固定的模式。

·数据存入HBase时都会打上时间戳，这个时间戳可作为版本号使用。 24·数据存储面临的主要问题：①系统②管理数据③异构数据的转换④大数据的应用 25·分布式数据存储重点解决的问题： ①存储设备的动态扩展②大文件的存储③存储节点的容错性④数据的快速检索 26·HDFS用户操作一个文件时，必须首先获得它的是（元数据） 27·Hadoop的基础是（mapreduce） 28·Redis属于（键值）数据库 29·Hbase属于（列族）数据库 30·MongoDB属于（文档）数据库 31·Neo4j属于（图）数据库 32·分布式文件系统的设计基于（C/S）模式

·列是列族数据库的基本存储单元 34·分布式文件系统HDFS读/写操作：写：①客户端申请写操作②NameNode检索权限③数据分块④建立传输管道⑤写入并确认读：①客户端申请读操作②NameNode检索权限③就近读取④将数据块合并 35·大数据的定义：包括因具备3V特征而难以进行管理的数据，对这些数据进行存储、管理、分析的技术，以及能够通过分析这些数据获得实际意义和观点的人才和组织。 36·在大数据的演变中，（开源软件）起到了很大的作用。 37·分布式系统是建立在网络之上的系统，它和网络之间的区别更多的在于（操作系统）。 38·在一个分布式系统中，（一组独立的计算机）展现给用户的是一个统一的整体，就好像是一个系统似得，分散的物理和逻辑资源通过计算机网络实现信息交换， 39·Hadoop是以（开源）形式发布的一种对大规模数据进行分布式处理的技术。 40·MapReduce是一种分布式处理的方法，而Hadoop通过开源的方式予以实现，且对其实现的形式并非只有Hadoop一种， 41·Hadoop三大核心组件：MapReduc 42·（云数据库）是基于云计算技术发展的一种共享基础架构的方法，是部署和虚拟化在云计算环境中的数据库。 43·关系数据库也是一个被组织成一组拥有正式描述的（表格），其中的数据能以不同的方式被存储，而不需要重新组织数据库。 44·关系数据库管理系统（RDBMS）的四个组件：存储介质管理程序、内存管理程序、数据字典、查询语言 45·MySQL的三个特点：体积小、速度快、开源代码 46·（索引）是一套包含定位信息的数据集，其中的定位信息会指明由数据库保存的那些数据块分别存储在磁盘的什么位置上。 47·（数据字典）作为RDBMS的一部分，记录了与数据在数据库中的存储结构有关的信息。 48·（约束）是一种规则，他可以进一步限制某列所能存放的数据值。 49·（结构化查询语言）是一种特殊目的的编程语言，用于存取数据以及查询、更新和管理关系型数据库。 50·SQL语言的功能：数据操纵、数据控制、数据定义 51·ACI 52·最终一致性：在某段时间内，多份数据副本的数值可能不同，但他们终究会相同。 53·最低响应数：只有当一定数量的服务器对读写操作做出响应时，该操作才算完成，而这个数就叫做“最低响应数” 54·NoSQL数据库所提供的各类解决方案能够处理很多种数据管理问题，它通常运行在（分布式）环境中。 55·所谓（事务），是指将包含多个步骤的流程视为一项不可分割的操作，从而协调地完成该操作。 56·为在响应时间、一致性、持久性之间寻求平衡，NoSQL数据库通常采用（最终一致性）来满足用户对一致性的要求。 57·CAP:一致性、可用性、分区保护性 58·键值数据库是形式最简单的NoSQL数据库，他围绕两个组件来建模，即（键和值）。 59·文档数据库的值是以文档的形式存储的。这里所说的文档，是一种的（半结构化）实体。 60·（列）是列族数据库的基本存储单元，他有名称和值。 61·列族数据的行可以由不同的（列或超列）来构成。 62·图数据库通过（图论）对数据进行存储、管理和查询的。 63·什么是分布式系统？运行在多个服务器的系统。 64·CAP定理中的C和A分别是什么意思？对于这两个方面来说，提升其中的某一个方面，可能会使另外一个方面难以维持。请举例说明。在进行两阶段提交时，数据库系统能够优先保证一致性，但是可能会使某些数据暂时不可用。在执行两阶段提交的过程中，对该数据的其他查询操作都会受到阻塞。必须等两阶段提交执行完毕，其他用户才可以访问更新后的数据。这就是一种通过降低可用性来提升一致性的情况。 65·文档数据库与键值数据库有什么区别？键值数据库会把实体的属性都与某个键关联起来，而文档数据库则把这些属性全部保存在一份文档中。 66·键值数据库使用一种比较复杂的（数组型）数据结构。 67·和普通数组一样，关联数组也是一种数据结构，但它的下标（不限于整数），而且也不要求所有的值都必须是同一类型。 68·键值数据库在底层所使用的基本数据结构是（关联数组）。 69·键是指向值的引用，它与（地址）的概念类似。 70·（列表）是由字符串构成的有序集合。 71·把数据分割成多个命名空间是一种非常有用的规划方式，与之类似的也可把集群划分为多个（分区）。 72·复制是一个向集群中存储多份副本的过程，数据库系统可以通过复制来提升（可用性）。 73·文档是一种灵活的（数据结构），他们不需要预先定义好模式，而是可以灵活地适应结构上的变化。 74·如果开发者既需要利用NoSQL数据库的灵活性，又需要管理复杂数据结构，通常会考虑采用（文档数据库）。 75·HTML文档中保存有两类信息，即内容和格式化命令。内容包括文本以及指向图形、音频、或其他媒体文件的（引用）。 76·（文档和集合）是用来规划文档数据库的两种结构。 77·把文档插入集合之后，可以用（updat 78·文档数据库的分区技术，特别是（分片）技术，可以把大型数据库切割到多台服务器上，以提升性能。 79·文档数据库的建模者不需要明确指定文档的正式结构，因而称为（无模式）数据库。 80·文档数据库的分区有两种，一种是（水平）分区，另一种是（垂直）分区。 81·文档数据库之所以灵活，关键因素之一就在于所用的（JSON、XML）文件格式的结构非常灵活。 82·规范化和去规范化是两种有用的处理流程。规范化可以减少的（数据异常）发生概率，而去规范化则能够（改善性能）。 83·为文档数据库建模时，（去规范化）是一种常见的做法。 84·关系数据库程序的开发者经常需要操作多张表格中的数据，那种（规范化）的模型能够缩减冗余数据的总量，并降低数据异常的风险 85·（去规范化）的基本思路是，把经常需要同时用到的那些数据放在同一个数据结构中，以减少文档数据库从持久化存储设备中读取数据的次数。 86·设计文档数据库的时候，要考虑（索引）的合适数量。如果太少，读取数据的效率就不高；反之，若是太多，则写入数据的效率又会变低。 87·列族数据库是（可缩放性）较高的一类数据库，它允许开发者灵活地变更列族中的各列，也提供了高度的可用性 88·在列族数据库中，（行）是由（列族）构成的，每个（列族）都包含一组相关的（列）。 89·从开发者的角度来看，列族数据库类似于（关系型表格），列则相当于（键值对）。 90·在BigTable中，数据值是根据行标识符、列名及（时间戳）来定位的。 91·列族数据库中的（列族）与键值数据库中的（键空间）是类似的。 92·Apach 93·列族数据库基本组件（行键）（列族）（列）和（键空间）。

1

更多题库