综合信息集成及查询优化的研究

来源 :大连理工大学 | 被引量 : 14次 | 上传用户:tp20201892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的发展,Web上各种在线信息源不断涌现,这些信息源种类繁多,结构各异。在互联网这样一个动态的环境中,各信息源不断地发生着变化,在这样一个动态、异构、开放的环境下快速、准确地获取信息是十分困难的。因此,研究信息集成系统,为用户提供一个访问异构数据源的统一接口有着非常重要的意义。在这种背景下,本文对信息集成系统的主要技术进行了深入的研究,具体研究工作如下: 信息集成系统体系结构是研究系统的组成模块以及各模块之间关系的。本文对目前几种典型的信息集成系统体系结构进行了分析,总结了这些体系结构的优点和不足。在对实际的信息集成工作中遇到的问题及其他相关需求进行分析的基础上,提出了综合信息集成系统体系结构。该体系结构既考虑对已有投资的保护,又考虑对不断生成的新数据的有效处理;既考虑对传统数据库中的数据和XML数据的处理,又考虑信息检索和辅助决策的需求。是一个面向目前大多数企业的综合信息集成系统。 模式映射的建立是信息集成系统的重要环节之一。本文提出了基于划分的映射模式发现框架——PBMSDF(Partition Based Mapping Schema Discovery Framework)。Dhamankar等提出了iMAP框架,该框架采用搜索器集合和Beam Search的方法,可以自动发现1:1映射、1:n和n:1的复杂映射,但是存在以下不足:一是不能发现m:n的复杂映射;二是该框架需要对属性及属性值实例进行分析,导致系统开销很大;三是对于Web信息集成,获取属性值的数据实例有时是不可能的,因此该框架不能用于Web信息集成。He等提出了DCM(Dual Correlation Mining)框架,该框架采用对属性在模式中的分布进行分析发现属性之间相关度的方法来发现属性之间的映射关系,可以解决iMAP框架中存在的问题,仍存在以下不足:一是由于该框架采用的相关度衡量标准对部分属性的评价结果不准确,导致发现结果准确性不高;二是该框架中采用的AprioriCorrmining和DualCorrelationmining挖掘算法在由相关e项集生成相关e+1项集的过程中,将整个属性集合中的每一个属性添加到相关e项集中构成候选相关e+1项集,然后再判断该e+1项集是否相关,增加了许多不必要的计算,致使搜索空间过大,算法的效率较低。本文提出了比较适合于衡量属性之间相关度的C-衡量标准,并在PBMSDF框架中采用了该标准以提高发现结果的准确度;提出了基于划分和栈的模式映射发现算法,理论分析和实验结果均证明,该框架较iMAP和DCM具有较高的性能和较好的模式发现能力。 XML成为目前Web上数据表示和信息交换的标准,处理XML数据是集成系统的功能之一,XML查询的效率将直接影响集成系统的性能。本文提出了一种基于递归模
其他文献
科技档案是企业档案的核心,它是记录企业整个科技发展历程的重要资料,对企业发展具有十分重要的作用,因此加强企业科技档案管理工作意义重大。文章就如何搞好企业科技档案管理工
12CM15型采煤机的电控部分均为单片机控制,实现了半自动化,连续采煤机工作环境复杂,PLC自动控制既安全,又可靠。介绍了12CM15连续采煤机截割滚筒系统中PLC的应用,提出操作和
农机监理执法是确保农机安全生产的必要手段,但在实际执法过程中常常会遇到一些困境,如责、权不一,农民法制观念淡薄等,所以需要强化农机监理执法人员素质,提高执法水平,加大宣传力
医疗保障的城乡统筹,是指在医疗保障制度的设计和运行中,打破城乡"-JL结构,构建覆盖城乡全体居民的一体化医疗保障体系。湖北省城乡医疗保障制度存在城乡失衡、异地就医结转困难
本文探讨了公平责任在医疗损害中适用的必要性.我国《民法通则》第132条确立了公平责任作为侵权责任的归责原则,但是并没有明确其具体适用的范围,法官在适用该原则时具有一定
湘鄂川黔革命根据地纪念馆位于湖南省张家界市区中心,于1991年夏在湘鄂川黔省革命委员会旧址修复新建,1993年12月26B落成开馆。 Hunan, Hubei, Sichuan and Guizhou Revolut
本文以医学科学为基础,分析了艾滋病患者的传染性,论证了艾滋病患者的隐私权与公众的生命健康权之间的法益博弈,对是否应当公开艾滋病患者的患病情况进行了深入解读.
目前我国的审判委员会议案机制存在审判分离、缺乏有效质证、违背控辨平等原则等问题。通过在审判委员会议案机制中适用证据规则,可以对审判委员会的证据审查、质证、判断和采
本文介绍了“驰名商标”概念和药品驰名商标保护的法律体系,对药品驰名商标的认定现状进行了剖析,认为目前在认定中存在着通过刻意制造法律纠纷获取驰名商标、确认驰名商标的
随着经济全球化的到来和Internet的广泛使用,Web(World Wide Web)逐渐成为全球企业合作的平台。研究基于Web的协同产品开发技术,对于企业适应环境、加强合作,从而赢得市场竞争具