数据集成技术若干问题的研究

被引量 : 50次 | 上传用户：a372092

【摘要】

：

近年来,计算机技术的不断发展和应用的广泛普及加快了人类社会信息化的进程。数据集成技术是解决目前普遍存在的“信息孤岛”问题的重要方法。数据集成系统的优劣评判标准是

【作者】

：

王欣

【发表日期】

：

2010年01期

【关键词】

：

数据集成数据不一致性质量指标模糊多属性决策普适计算模糊多属性群决策系统效用完美信息价值

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,计算机技术的不断发展和应用的广泛普及加快了人类社会信息化的进程。数据集成技术是解决目前普遍存在的“信息孤岛”问题的重要方法。数据集成系统的优劣评判标准是看该系统是否能使用户以最小的代价,高效率的使用这些数据。系统是否能够提供一致的数据是实现此标准的基础。所以,针对数据集成中的数据不一致性问题,本文基于以下两个方面展开了研究:1)通过对数据集成系统返回查询结果中的不一致数据进行分析、解决,从而得到一致的查询结果。基于这种方式,本文基于数据源质量开展了相关研究,提出了解决方法,并给出了普适计算环境下的解决策略和算法。同时设计实现了一个原型系统。2)由数据集成系统提供不一致的数据集,并由专家对所有不一致数据进行集中评估。基于这种方式,本文重点研究了专家参与解决数据不一致性问题时如何取得最好的系统收益。具体而言,论文的主要研究工作和创新性包括以下几个方面:1)针对数据集成中数据不一致性问题提出了基于数据源质量的解决方法。本文定义了数据源质量指标,设计了数据集成的数据模型。基于该数据模型,对数据集成中的数据不一致性问题给出了明确的定义。为了能够处理定性的指标值,使用模糊多属性决策方法来解决查询结果中的不一致数据。并基于实验进行验证,得到了良好的实验结果。2)由于普适计算环境具有动态性的特点,普适环境中数据源质量可能经常发生改变并且获得实际的数据源质量是非常困难的。本文针对普适环境的特点,提出了基于模糊多属性群决策的方法来解决数据集成中的数据不一致性问题。本文使用数据质量指标和消费质量指标来描述数据源的质量。在数据质量指标中,定义了一个数据源属性――“历史可信度”。“历史可信度”表示在数据不一致性问题的处理过程中,数据源提供数据的整体正确程度,并且可以基于用户反馈修改该属性的值。本文提出的解决方案首先基于数据源的消费质量指标,使用效用函数对数据进行初步筛选。然后使用了数据质量指标和模糊多属性群决策方法来选择最合适的数据源提供的数据作为查询结果中不一致数据的解决结果,并将一致的查询结果提供给用户。根据用户反馈,调整相关数据源的历史可信度指标值。实验结果验证了本文提出方法的有效性。3)领域专家参与解决数据集成系统中的数据不一致性问题时,针对如何让专家的评估更有效率,使数据集成系统取得最大的收益,本文提出了基于完美信息价值的解决方法。本文基于查询结果的质量来评估系统效用,定义了系统效用公式,并进一步得到了完美信息价值的计算公式。根据计算得出的完美信息价值对所有待评估的不一致数据集进行排序,使专家的评估可以最大化系统收益。并基于实验验证方法的有效性,得到了良好的实验结果。4)基于本文提出的解决数据不一致性问题的方案,设计实现了上海世博数据集成子系统的原型系统。该系统采用了基于可信度的数据集成技术,以服务总线和XML为基础,以基于模式的集成为核心,基于Web服务统一封装异构数据源。在该子系统中,用户可以根据需要选择是否解决查询结果中的数据不一致性问题,这增强了系统的灵活性。世博数据集成子系统采用近似面向对象的数据模式管理方法对系统内数据进行描述和集成,并基于效用函数和模糊多属性群决策的方法对不一致数据进行解决。

其他文献

情境陈列不仅是漂亮

<正>情境陈列是近年来大家都比较重视的一种陈列方法,大到商场内外的全局规划,小到品牌和产品拟人化特征的塑造,许多家电品牌也都在运用这种陈列方式,甚至有专业的陈列设计师

期刊

中心岛家电产品场景化飞利浦服装品牌主题情境季节性消费者功能性市占率小家电

培养大学生机械创新设计能力研究

加强对大学生的创新能力的培养，已经成为我国高等教育推进素质教育的核心课题。大学生机械创新设计大赛作为教育部负责组织的重要赛事，对培养机械类学生的创新能力起着重要作用

期刊

大学生机械创新设计素质教育创新能力

凝聚力量促发展转变作风提效益——大唐广西分公司抓党建促发展工作纪实

在大唐广西分公司．每个党员的桌面上都摆放着一张醒目的“党员服务保障示范岗”桌牌。小桌牌彰显的却是大责任。大唐分公司成立以来，始终以抓党建、促发展为工作着力点，充分发挥

期刊

学习型党组织促发展党风廉政建设创先争优活动战斗堡垒作用凝聚力量

反渗透除盐设备的几种防垢方法

反渗透除盐设备的几种防垢方法北京美迪托－罗莱尔水处理有限公司张烽反渗透技术在５０年代末、６０年代初投人实际使用时主要用于对海水及苦咸水的淡化，但是随着人类对污染控制及节能等

期刊

反渗透装置反渗透除盐除盐设备

同城化社会变迁中的跨界钟摆族群体研究

跨城市生活的钟摆族是在全球化、网络化、城市区域一体化背景下时代变迁中产生的新兴群体,其生存状况、生活方式、社会适应均折射出当代社会变迁中存在的深层次矛盾和问题,成

学位

钟摆族跨城市生活同城化社会变迁

双级防气窜固井技术在也门Judayaah-1井中的应用

Judayaah-1井是也门71区块的一口探井,该井三开Φ244.5 mm套管固井存在着相对高压气层、封固段长、气窜风险大等固井难点。为确保该井固井质量,对固井难点进行了分析,针对该

期刊

固井水泥浆体系防气窜封固段设计固井工具

建筑内墙抹平、刮腻子机械手设计研究

论文从建筑内墙抹平、刮腻子等作业方式出发,提出了一种可以进行墙面施工作业的机器手,对机械结构进行了设计,并建立了三维模型,对刮腻板进行了优化分析。

期刊

墙面抹平刮腻子机器手结构设计

幽门螺杆菌感染的病机

幽门螺杆菌感染可引起急性、慢性浅表性胃炎及消化性溃疡，在非溃疡性消化不良、慢性萎缩性胃炎、胃淋巴瘤及胃癌的发生中也是主要的原因之一。正因为如此，有关幽门螺杆菌的研究

期刊

胃粘膜屏障幽门螺杆菌感染十二指肠粘膜胃泌素尿素酶

论童话在小学教育戏剧中的应用

本文通过对小学教育戏剧中童话应用模式的实践探讨,提供了应对教育戏剧发展瓶颈的一种尝试。在明确了教育戏剧促进儿童人格全面发展的理念和优势后,如何运用这一教学方法结合

学位

健全的儿童素质教育教育戏剧童话儿童心理童话形象故事张力

一种新的系统生存性量化分析方法

信息化战争条件下,雷达组网系统面临着严峻的“舒特”攻击。通过将攻防过程描述为拟生灭过程,对系统建立了数学模型,定量地来刻画系统所面临的安全威胁,并给出重要性能指标的

期刊

雷达网生存性模型

数据集成技术若干问题的研究

与本文相关的学术论文