基于XML的非结构化数据管理研究及应用

被引量 : 0次 | 上传用户:wangke777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的进步和科技的发展,特别是Internet的广泛应用,人们要面对的信息量越来越多。统计资料表明,20%左右的结构化信息有效地存储在各种类型的结构化数据库中,但还有80%左右的非结构化信息分散在整个业务过程及外部环境中。非结构化信息已成为政府、企业等决策的依据。怎么样有效的管理好这些非结构化数据,并挖掘出这些数据的内在联系和知识重点是目前急需解决的问题。传统的数据管理特别是关系数据库系统,应用中对非结构化的数据只提供一些表层的管理;而目前对于非结构化信息的处理方式,侧重于电子化的文档的处理,缺乏对非结构化信息全生命周期和智能化的管理,实现起来较为复杂或效率较低,需要付出较为昂贵的代价。XML对非结构化数据的管理方式成为非结构化数据管理的一种经济的、简单的、可行的方式。本文通过分析Word文档、Excel文档、Web网页等非结构化数据的结构特点,创建各自对应的转换程序来读取这些非结构化数据的内容,使用不同的转换规则将其分别转换成为标准XML文档,使得对非结构化数据的管理转换为对半结构化数据的XML文档的管理;再通过以模板驱动建立XML文档数据与关系数据库的映射关系,按照一定的转换规则将XML数据转换成为结构化数据,为传统的基于关系模型的数据库所支持。本文的创新之处在于提出了XML对非结构化数据管理的设计及实现方案,该方案满足了多种类型数据融合的需要。综合文中提出的算法和过程,本文成功的实现了基于XML的长沙市中学生综合素质评价系统的开发,使中学生综合素质评价过程中所需要使用到的各类非结构化数据得到较为方便的管理。在通过进一步的完善和改进之后,本系统能够为今后中小学综合素质的评价工作做出应有的贡献。
其他文献
中国现代农业正随着改革开放的深入和供给侧改革的迈进而日新月异地进步发展,市场亟需一种全新的农业生产模式来适应这飞速发展的时代步伐。如何探寻和实施新的农业生产模式
专科医师规范化培训是国际上公认的临床医学专家成长的必由之路,对保证临床医师的专业水准、加强卫生人才队伍建设和提供高质量的医疗服务具有重要的、不可替代的作用。但是,
以顾客为中心理论的发展,使得企业的营销理念逐步从产品导向转变为顾客导向,吸引、维系优质顾客成为企业的必然选择,顾客在成为企业不可或缺的战略性资源的同时,顾客资产也成
近年来,国家大力支持休闲农业的发展,各地区根据本地区实际情况,积极发展休闲农业,加之,休闲农业的消费人群对休闲农业需求日益增加,休闲农业在全国各地快速发展。在广大农村
针对煤矿工程采矿技术的应用现状,进行有效的分析,并简要介绍了加强煤矿工程施工安全管理的重要价值、煤矿工程采矿技术应用要点,如深层井采矿技术、硬顶采矿技术等等,提出煤
本研究采取比较屠宰法测定2035 kg杜泊羊×湖羊(杜湖)F1代公羔代常量元素[钙(Ca)、磷(P)、钾(K)、钠(Na)和镁(Mg)]的维持和生长需要量。选择35只杜湖F1代公羔[初体重为(19.20±0.36)kg]作为
农业是人类的衣食之源和生存之本。耕地是农业最主要的生产基础,是人类赖以生存的基本资源和条件。我国实行最严格的耕地保护制度,但现阶段耕地保护的形势依然不容乐观。破解
农业产业是支撑国民经济不断发展与进步的保证,为第二、三产业的发展提供广阔的市场,但农业生产方式粗放、竞争力不强、农民持续增收难度大等问题日益突出,在全面建成小康社
针对目前航道测绘数据录入空间数据库转换成.shp格式的过程工作量大,格式转换耗时易错的现状,本文使用VBScript脚本语言进行基于EPS平台的SHP数据批量转换工具的开发,实现了