更新时间: 试题数量: 购买人数: 提供作者:

有效期: 个月

章节介绍: 共有个章节

收藏
搜索
题库预览
其他. (E-mail 、BBS) 内网、外网和因特网上的多源异构数据源的整合, 2技术管理的三个方面: 1提供先进的网络信息组织技术,以保证网络信息的有序性和利用的方便性: 2提供网络信息安全技术,以保证网络信息存储、传输和利用过程中的安全性: 3提供其他各种网络信息相关技术,以保证网络信息传播过程中的可靠性、稳定性和高速度。 网络信息组织 人们根据网络信息本身的特征,运用各种工具和方法,对网络信息进行加工、整理、排列、组合,使之有序化、系统化、规律化。 特点 海量网络信息和信息生产、传播速度加快,对传统信息加工方式提出挑战,信息组织的技术从手工向半自动化、自动化、智能化发展。 信息种类增多,数据库成分复杂,过去适用于文本信息的组织方法适用度降低。 网络信息用户对信息组织有专门的需求。 网络信息形式的非线性、交互性和动态性,需要信息组织方法及时而灵活。 网络信息组织的方法(简答/论述) (1)文件组织方式 文件组织方式把相关的网络信息按照统一的规则和方法组织成文件,并借助于专门的文件管理系统来对这些文件进行管理。在这种方式中,网络信息的存取是以文件为基本单元的。如FTP(FileTransfer Protocol) 文件是性质相同的记录的集合 常用的文件组织方式:顺序文件、索引文件、散列文件和多关键字文件。 顺序文件是指按记录进入文件的先后顺序存放、其逻辑顺序和物理顺序一致的 文件。 索引文件的组织方式:通常是在主文件之外建立一张索引表指明逻辑记录和物理记录之间一一对应的关系,它和主文件一起构成索引文件。 散列文件是利用散列存储方式组织的文件,亦称为直接存取文件。 多重表文件:对需要查询的次关键字建立相应的索引,对相同次关键字的记录建一个链 表并将链表头指针、长度、次关键字作为索引表的索引项。 优点:简单方便;存储非结构化信息的天然单位 缺点:难以平衡网络负载与文件数量之间的关系;对结构化信息的处理显得软弱无力;随着以文件方式保存和管理的信息资源迅速增多,文件本身也需要管理。 (2)数据(仓)库组织方式 数据库方式是在文件方式的基础上发展起来的。这种方式区别于文件方式的重要标志在于其存取的基本单元不是文件,而是从整体的观点来规划和设计的具有一定结构和规律的信息 数据仓库是支持管理决策过程的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。我们可以这样来理解:数据仓库为支持海量存储和高层决策分析提供了一种解决方案 。它抽取和净化来自不同应用系统的数据,从事物发展和历史的角度进行组织和存储,并通过对这种集成化数据的分析和挖掘,为最终用户提供综合性和分析性的深层次信息,是基于传统数据库技术的一种应用拓展。 数据仓库的特点: (1)海量信息:数据仓库的数据量应足以支持数据分析、查询报表生成以及与历史数据的对比,因此容量远远大于一般的数据库。数据仓库的一般容量在 50GB左右,大型的可达到TB级。 (2)数据面向主题:数据仓库围绕确定的主题来组织和提供数据。 所谓主题就是根据用户提出的决策需求进行抽象的结果。每一个主题基本对应一个宏观的分析领域, 可以统一刻画出各个分析对象所涉及的各项数据及数据间的关系,具有更高的数据抽象级别。 (3)数据的集成性:由于数据仓库中的数据来自不同的信息源,进入数据仓库之前,必须统一原始数据中的所有矛盾之处,进行合理的重组、转换与集成,以适应数据仓库面向主题的要求。 (4)数据的稳定性:数据仓库反映的不是日常事务中的联机处理数据,而是相当长时间内的历史数据,一般不进行数据的即时更新,因此具有相对的稳定性。 (5)数据的时间变化性:数据仓库是不同时间的数据集合,其保存的数据具有一定的时限, 随着时间的变化,需要不断增加新内容,删去过时的信息以及对综合数据进行重新计算综合。 优点:大大提高了数据操作的灵活性;降低了网络传输的负载,为非机构化信息的组织提供了良方; 缺点:对非结构化信息处理比较困难;不能提供数据信息之间的知识关联;对用户和数据库服务端提出了较高的要求 (3)主题目录组织方式 主题目录方式组织网络信息的基本做法是先按照某种事先确定的概念体系结构建立等级式主题目录,然后以超文本链接的方式将不同学科、专业、行业或区域的信息按照主题目录的分类要求逐级组织起来。 以主题目录方式组织网络信息的难点在于如何科学而合理地建立信息分类体系。如房地产 优点:简单易用;这种方式提供了一种较为友好的界面,用户在主题目录的指引下,通过逐层浏览,可找到与自己的需求有关的信息。如yahoo!;采用数层结构组织信息资源,具有良好的可扩充性和系统性。 缺点:必须时间建立一套范畴体系;每条类目下的索引条目不宜过多,降低了网络信息资源的数量;是由人工主导的,管理方面跟不上网络信息的增长速度,收录范围不够全面,新颖性和即时性较差。 (4)超媒体(hypermedi 超媒体技术是超文本技术和多媒体技术的结合体,可将文字、图表、图像、视频、音频等多媒体信息以超文本方式组织起来。 超媒体是一种非线性的网状结构,在超媒体系统中,用户不必按顺序地沿着时间或空间轴按部就班地搜寻.也不必过多地担心在航行时会迷失方向或引起混乱,因此,这种技术刚一成熟便受到了网络信息组织者的青睐。 在超媒体方式下,网络信息存取的基本单元是节点(nod 以超媒体方式组织网络信息的难点在于如何解决在庞大的超媒体信息网络中迅速定位的问题。用搜索引擎。 优点:符合人们跳跃的思维方式;具有良好的可包容性和可扩充性;超越了媒体类型对信息组织检索的限制;避免了检索的复杂性。 缺点;如何解决在庞大的超媒体信息网络中迅速定位的问题。用搜索引擎。 无法保留浏览过程中的多有历史记录 搜索引擎(Searc 是一种 we 信息,在对信息进行处理和组织后,为用户提供 we 优点:1收录、加工信息的范围广、速度快2检索功能强,一般 可称为网络资源的关键词索引3检索时直接输入关键词或词组、短语,无需判断类目归属,比较方便 缺点:1标引过程缺乏人工干预,准确性较差2检索误差(噪音)较大3搜索引擎适合于检索特定的信息,及较为专、深、具体或类属不明确的课题 元搜索引擎(Metasear(  )