数据空间中基于概念相似度的模式集成方法研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:ZXCVB1230ZXCVB
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web和数字技术的发展,数据呈现出了海量、异构、高速增长等特点。由于传统的DBMS已经不能满足现代数据管理的需要,人们提出一种新的面向主体的数据管理技术——数据空间。与传统的数据库管理系统不同,数据空间面向实体需要,大小动态变化,具有Pay-as-you-go的特性,它先有数据后有模式,并且具有包括数据本身、模式匹配和查询处理三个层次上的不确定性。数据空间中对于模式的研究对于查询的构造和优化具有非常重要的意义。目前的模式集成方法要么基于关系模式,要么基于人工指定完成概念的匹配和集成,均不能体现数据空间的特点。本文提出了一种基于概念相似度的数据空间模式集成方法。我们首先针对结构化的关系数据和半结构化的XML数据进行模式提取,对于结构化的关系数据,通过元素转换法将关系模式转换成XML Schema形式;对于XML数据,则利用SAX解析器提取出XML Schema。模式集成则根据概念间的相似度完成概念的匹配和集成,同时借助义类词典来提高概念间的匹配度。与现有的方法相比,基于概念相似度的数据空间模式生成方法利用概念间的相似度来完成匹配,只需通过阈值的设定就能得到匹配结果,并生成基于树型结构的模式,实现了数据空间模式的自动集成。
其他文献
学位
随着网络的日益普及和电子商务的快速发展,信息推荐实现了从传统的“人找信息”向“信息找人”的网络服务模式的转变。协同过滤技术是当前推荐系统主要采用的技术,它能够发掘
随着信息科技的进步和通信技术的不断发展,计算机技术已发展到以网络为中心的信息交互时代。网络服务站点也不再局限于提供HTTP、FTP等传统类型的服务,新的服务类型如流媒体
数据仓库和数据挖掘技术是信息技术研究的热点问题之一。数据仓库是一个支持管理决策过程的、面向主题的、随时间而变的数据集合,它是集成的,也是稳定的。数据挖掘是采用人工智
目前电子商务网站数量众多,信息资源总量庞杂、增长速度飞快,导致用户在整个商品空间上出现信息迷航和信息过载问题,信息使用效率降低。现有的电子商务网站搜索系统和搜索引
国际电信联盟(ITU)表示,2009年底,全球手机用户数量已经达到46亿,而到今年年底,全球手机用户数量将达到50亿。虽然全球经济经历了低迷阶段,但是用户对通信服务的需求仍在提升
随着信息技术的快速发展,软件的应用变得越来越广泛。软件规模越来越大、功能的增强和复杂度的增加使得软件的成本、进度和质量变得难以控制,这些问题己经日益成为人们关注的焦
伴随着Web Services技术在信息技术各个领域内的广泛应用,基于Web Services技术的Web服务的可用性、可靠性和稳定性成为了服务提供商和服务使用者普遍关注的焦点,服务提供商
现实世界的数据往往具有较高维度,直接应用传统数据挖掘技术将面临“维灾”问题。因此,研究有效的降维算法,寻求在低维上进行数据分析,成为数据挖掘研究热点。但是,许多传统
目标跟踪技术经过不断的发展,已经出现卡尔曼滤波、均值漂移和粒子滤波等算法,算法的性能高低决定着跟踪效果的好坏。目前的主流跟踪算法都能适应比较简单的环境,但对于稍微