数据空间中基于概念相似度的模式集成方法研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户：ZXCVB1230ZXCVB

【摘要】

：

随着web和数字技术的发展,数据呈现出了海量、异构、高速增长等特点。由于传统的DBMS已经不能满足现代数据管理的需要,人们提出一种新的面向主体的数据管理技术——数据空间

【作者】

：

侯虹霞

【机构】

：

北京交通大学

【出处】

：

北京交通大学

【发表日期】

：

2010年01期

【关键词】

：

数据空间模式提取概念概念相似度模式集成

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着web和数字技术的发展,数据呈现出了海量、异构、高速增长等特点。由于传统的DBMS已经不能满足现代数据管理的需要,人们提出一种新的面向主体的数据管理技术——数据空间。与传统的数据库管理系统不同,数据空间面向实体需要,大小动态变化,具有Pay-as-you-go的特性,它先有数据后有模式,并且具有包括数据本身、模式匹配和查询处理三个层次上的不确定性。数据空间中对于模式的研究对于查询的构造和优化具有非常重要的意义。目前的模式集成方法要么基于关系模式,要么基于人工指定完成概念的匹配和集成,均不能体现数据空间的特点。本文提出了一种基于概念相似度的数据空间模式集成方法。我们首先针对结构化的关系数据和半结构化的XML数据进行模式提取,对于结构化的关系数据,通过元素转换法将关系模式转换成XML Schema形式；对于XML数据,则利用SAX解析器提取出XML Schema。模式集成则根据概念间的相似度完成概念的匹配和集成,同时借助义类词典来提高概念间的匹配度。与现有的方法相比,基于概念相似度的数据空间模式生成方法利用概念间的相似度来完成匹配,只需通过阈值的设定就能得到匹配结果,并生成基于树型结构的模式,实现了数据空间模式的自动集成。

其他文献

基于物理层安全链路选择机制的研究

学位

基于领域知识的协同过滤推荐研究

随着网络的日益普及和电子商务的快速发展,信息推荐实现了从传统的“人找信息”向“信息找人”的网络服务模式的转变。协同过滤技术是当前推荐系统主要采用的技术,它能够发掘

学位

协同过滤领域知识候选近邻集合用户兴趣组平均绝对偏差

基于Multi-Agent的动态负载平衡技术研究及应用

随着信息科技的进步和通信技术的不断发展,计算机技术已发展到以网络为中心的信息交互时代。网络服务站点也不再局限于提供HTTP、FTP等传统类型的服务,新的服务类型如流媒体

学位

集群Agent动态负载平衡JADE平台容错管理模糊控制

数据仓库和数据挖掘在高校成绩分析中的应用

数据仓库和数据挖掘技术是信息技术研究的热点问题之一。数据仓库是一个支持管理决策过程的、面向主题的、随时间而变的数据集合，它是集成的，也是稳定的。数据挖掘是采用人工智

学位

高等院校成绩分析数据仓库数据挖掘

基于用户行为的电子商务推荐系统的设计与研究

目前电子商务网站数量众多,信息资源总量庞杂、增长速度飞快,导致用户在整个商品空间上出现信息迷航和信息过载问题,信息使用效率降低。现有的电子商务网站搜索系统和搜索引

学位

电子商务信息过载个性化推荐协同过滤

Windows Mobile平台信息管理系统的设计与实现

国际电信联盟(ITU)表示,2009年底,全球手机用户数量已经达到46亿,而到今年年底,全球手机用户数量将达到50亿。虽然全球经济经历了低迷阶段,但是用户对通信服务的需求仍在提升

学位

Windows Mobile垃圾短信过滤来电防火墙私密信息保护

基于CMMI的软件过程度量及原型系统研究

随着信息技术的快速发展，软件的应用变得越来越广泛。软件规模越来越大、功能的增强和复杂度的增加使得软件的成本、进度和质量变得难以控制，这些问题己经日益成为人们关注的焦

学位

能力成熟度模型集成软件过程度量度量和分析过程改进

Web Services性能测试方法的设计和实现

伴随着Web Services技术在信息技术各个领域内的广泛应用,基于Web Services技术的Web服务的可用性、可靠性和稳定性成为了服务提供商和服务使用者普遍关注的焦点,服务提供商

学位

Web Services性能测试压力测试多机联合测试测试策略负载均衡

健壮的流形学习算法及其应用研究

现实世界的数据往往具有较高维度,直接应用传统数据挖掘技术将面临“维灾”问题。因此,研究有效的降维算法,寻求在低维上进行数据分析,成为数据挖掘研究热点。但是,许多传统

学位

流形学习共享近邻局部相关维度监督学习核函数

抗遮挡与重采样的粒子滤波跟踪算法研究

目标跟踪技术经过不断的发展,已经出现卡尔曼滤波、均值漂移和粒子滤波等算法,算法的性能高低决定着跟踪效果的好坏。目前的主流跟踪算法都能适应比较简单的环境,但对于稍微

学位

粒子滤波似然分布局部二值模式局部三值模式抗遮挡重采样

数据空间中基于概念相似度的模式集成方法研究

与本文相关的学术论文