基于XML的异构数据处理技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:yfyzp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以电子政务应用为背景,研究了基于XML的异构数据交换技术和文本自动分类技术。重点研究了关系数据库模式到XML模式的映射以及XML的关系数据库存储技术。通过基于用户请求的关系模式的提取、关系模式的分割、关系模式表及SQL语句的构造、映射算法的设计和数据的嵌入,完成关系模式到XML模式的映射。这种映射方法能够完整地保留关系模式的实体完整性和参照完整性约束。在实现XML的关系数据库存储时,引入了结构和内容分别存储(也即XML Schema和XML文档的分别保存)的方法实现XML的关系数据库存储。这种存储方法的引入,放宽了对数据发送方数据表示格式的限制,同时也节约了存储空间。 为了实现对接收方所接收数据的分类管理,在比较现有文本分类技术的基础上,研究分析了模糊聚类在文本分类中的应用,设计并实现了基于模糊聚类的文本分类器。
其他文献
随着网络用户和网络应用的规模呈爆炸性增长,网络运营商不得不投入大量的成本升级、扩容现有网络,以满足用户日益增长的带宽需求。但是网络设备的升级改造却远远赶不上用户规模
随着遥感技术的发展,遥感影像已成为地理空间信息领域重要的数据来源。遥感影像的分辨率越来越高,数据量达到了PB级。如何高效地组织、存取海量遥感影像成为研究的热点问题,其中
推理是Agent研究的核心问题之一,基于Agent本身的属性和环境特点,易于看出动态性、模糊性贯穿于推理过程的始终。而自1996年李凡长等人发表了动态模糊逻辑(Dynamic fuzzy log
自从1987年Yablonovitch和John各自独立的提出“光子晶体”这一新概念以来,光子带隙结构(Photonic Bandgap,简称PBG)在微波与毫米波集成电路的应用越来越成为研究热点。目前,国
NP-完全理论是算法研究方面的重要的基本理论,它在计算机、电气工程和运筹学方面都有重要的地位。本文主要以算法技巧为着眼点来研究此类问题,希望在解决方式上有新的突破。加
互联网技术的进步和电子商务的快速发展要求在构建新企业应用的时候,新构建的应用既能够方便地与企业现存的各种遗留系统进行通信,又能够方便地与将来的系统进行通信。以此为
随着网络技术的飞速发展,软件产业的不断进步,企业对计算机技术依赖程度越来越高。软件也从单机的软件工具,发展为分布式,网络化,集信息自动化、数据存储、企业管理、企业策划等越
近年来,随着企业对计算要求的不断提高,计算机应用系统开始由集中式向分布式发展。软件的体系结构也从C/S模式转向了多层应用体系结构。以工业故障诊断系统为例,在很多工业故障诊
市场经济中,开展上市公司业绩评价在理论、实践上均具有重要作用。无论是对政府转变职能和加强宏观调控,还是对公司改善经营管理,以及投资者及时调整投资决策,都有十分重要的意义
便携式媒体播放器(PMP)是今年被讨论最多的一个话题。PMP播放器的优点很多,它能够直接播放高品质视频、音频,也可以浏览图片以及作为移动硬盘、数字银行使用,更有产品还具备一些