异构数据库语义集成技术研究

被引量 : 0次 | 上传用户:gdp1959
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的迅猛发展和Internet 技术的广泛应用,给人们的生活、工作和学习带来了极大的方便。但随着人们对信息综合利用需求的进一步提高,Internet的局限性也凸现出来,因为计算机互连网络实现的是一种硬件的连通,所连接起来的信息大部分是异构的,形成了一个个信息孤岛,很难达到互联互通,真正实现数据的共享。信息的不一致造成有限的信息共享、缺少数据交换是制约实现数据综合利用的主要瓶颈。因此,如何找出并消除异构数据库中数据的冲突、异常,进行数据库集成,是实现综合信息应用必须解决的问题。数据库集成技术可以有效地检测数据异常、尽早地调整数据、消除数据的不完整和不一致,从而有助于提高信息综合利用的质量。异构数据库集成的关键问题是找出异构数据库间相同的语义对象,即语义集成,具体到关系数据库中,就是要找出异构数据库间相同的属性和实体(记录),即属性匹配和实体匹配问题。本篇论文主要在分析研究了现有异构数据库语义集成技术特点的基础上,针对目前方法的不足,考虑到神经网络具有较强的自学习能力和推广能力,比较适合处理语义集成这类不确定性问题,将神经网络理论应用到异构数据库语义集成中的属性匹配和实体匹配领域。同时,在解决实体匹配问题时,针对属性权重难以准确计算的问题,我们分别考虑了属性的信息熵和互信息来估算属性的权重。从提高识别相同语义对象的查准率和查全率两个重要指标出发,提出了新的属性匹配和实体匹配算法,并在具体应用环境中的数据库上进行了实验,取得了理想的效果。本论文主要研究工作如下: ①全面地综述了目前异构数据库集成所涉及的主要问题,详细地介绍了异构数据库语义集成的任务、语义异构的类型和解决语义异构问题主要采用的方法,并对目前方法的特点和不足之处进行了研究,分析了将神经网络理论、信息熵和互信息理论引入异构数据库语义集成领域中解决属性匹配和实体匹配问题的可行性。②分析了目前文献中基于BP 神经网络的属性匹配方法的不足,指出不同的输入在神经网络上可能对应相同的输出是影响神经网络结果准确性的主要因素之一,并进行了理论上的证明和具体实验环境的验证。为了解决该问题,在论文中提出了用相同的训练数据在不同的初始权值和阈值的情形下多次训练神经网络,从而构建不同于一般多级分类器方法的多个分类器的思想,可以实现对干扰数据的有效过滤。该思想在本文的第三章和第五章得到了很好的体现。
其他文献
文章对航天器用热传输技术近期的发展进行了汇总,主要包括:导热材料、微小型热管、槽道热管、泵驱动两相流体回路、深冷环路热管、喷雾冷却系统以及基于MEMS技术的微型热传输
空冷风机大多采用变频器调速运行方案来达到节能目的,但变频运行中也存在诸多问题。对此,在变频调速基础上提出几种可行性方案,并对比分析各方案的优缺点,为今后合理选择空冷
目的:探讨板蓝根抗细菌内毒素作用.方法:分别用细菌内毒素检查法、热原检查法、对内毒素致小鼠毒性保护力、对内毒素致鼠巨噬细胞释放炎性因子抑制作用及内毒素定量检测等方
介绍如何实现单体支柱工作面的合理支护,即通过选择合理的支护设计,利用“支护质量与顶板动态监测”和“班评估”来保证设计参数实施,并进一步优化支护参数。
本文介绍了如何提高气相色谱分析试验检测器灵敏度的方法,结合针对所用的气相色谱仪的特点,总结提高检测器灵敏度的有效手段,为提高分析油中溶解气体的准确性,进一步判断充油电气
近年来,留守儿童自残行为有了蔓延的趋势而且极具危害性。导致农村留守儿童自残的因素很多,有学习压力、感情因素、家庭贫困、父母关系等,家庭教育缺位和贫困是主要因素。但
任何艺术的发生、发展,都离不开适宜的土壤和氛围。千百年来盛开不衰的戏剧之花,在中华五千年传承的人文积淀的土壤上,越发艳丽无比。戏剧的角色作为个体元素,丰满了艺术再现的辉
三台子矿区二期供水工程水源取自两家子水源地,水源水质铁、锰超标严重,设计采用了机械通风接触式曝气塔+无阀过滤器二级串联处理工艺,工艺处理及污泥处理实现了全部设备化,
<正> 猪瘟是猪的一种主要传染病,最早称猪霍乱,我国有人叫烂肠瘟,病原是猪瘟病毒(Hog cholera virusHCV)。猪瘟病毒原属披膜病毒科(Toga Viridae)瘟疫病毒属(Pesticirus),现
本文首先介绍了ASP 技术的工作原理及其运行环境。其次,详细地介绍了数据库的一些基础知识,将数据库技术与ASP 技术进行了理论上的结合。随后,简单的介绍了网页制作工具Dream