面向多源异构数据的集成方法研究与应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:elrshay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的发展,不同信息系统中都存在着海量数据,各系统之间由于应用目的不同、数据存储规范不同,导致各系统数据之间存在异构性,数据彼此隔离无法连通。数据间存在的多源异构性使其无法实现统一管理和共享,容易产生信息孤岛、技术孤岛、资源孤岛等问题,难以进行领域数据的联合分析。为了解决当前面临的问题,充分发挥数据价值,需要对多源异构数据进行数据集成,数据集成是实现信息共享、构建数据统一访问的关键技术。本研究重点内容是高校多源信息系统之间的数据集成问题。在当前业务场景中,各个数据源是由不同的组织使用不同的模型或规范进行设计,由于技术和人为因素的限制,不同数据源的存储方式和标准存在差异,数据源间存在模式异构、语义异构等问题,如何提高异构数据利用率成为亟待解决的问题。为了实现多源异构数据间的关联访问,提出一种数据集成方案用于对各个异构数据源进行有效整合。为了克服传统数据集成方案查询效率低下,自动化程度不高的问题,本文引入语义网络基于本体技术进行数据集成;为了提高本体的表达能力,引入数据库元数据信息基于BP神经网络算法进行关联分析。研究内容如下:(1)基于本体技术对数据进行集成,首先根据多源数据库构建局部本体,针对局部本体,使用多种相似度算法对局部本体进行匹配,解决不同本体概念以及属性之间的语义冲突。在多种相似度算法得出的相似度矩阵汇聚运算时,考虑不同矩阵数据特征对结果的影响,使用动态自适应权值的方式进行矩阵融合,保证结果的客观性,最终通过稳定婚姻算法选出概念之间的映射关系。(2)为了充分利用数据库元数据信息提高本体的匹配能力,引入BP神经网络算法对本体匹配过程进行关联分析,利用神经网络的自学习能力进行属性匹配。最后,通过本体相似度计算与BP神经网络相结合的方式计算局部本体概念之间的映射关系,通过映射关系构建领域全局本体,通过把对多源信息系统的查询转换为针对全局本体的查询,进而完成多源异构数据之间的集成工作。(3)对本文提出的基于本体和神经网络的数据集成方式,分别在公开数据集和真实场景数据集上进行实验,实验结果表明本文算法在数据集成中具有良好的性能。最后,结合实际应用场景,把本文算法应用到异构数据集成平台中,为数据用户提供统一的数据查询视图,实现多源异构数据之间的联合访问。
其他文献
学位
电磁场与微波技术课程数学公式多,理论复杂,内容抽象,应用性强。针对以上特点,结合贵阳学院学生数学基础较差,教学效果不佳的现实情况,文章旨在探讨并寻求有效的课程教学与考核方式的改革措施。在课堂教学方面,文章讨论了引入电磁学发展史中的科学背景故事作为课程导入,采用翻转课堂,增加仿真设计等教学方式改革对教学效果的作用。同时针对以上教学方式的改革,文章还探讨了平时成绩量化,考试题型改革,线上学习考核等措施
目的基于全国脑卒中高危人群筛查数据,研究心房颤动(Atrial Fibrillation,AF)共存其他危险因素与缺血性脑卒中(Ischemic Stroke,IS)患病风险的关联,为针对不同状况的AF人群制定IS预防策略提供依据。方法采用2014至2015年度“中国脑卒中高危人群筛查与干预项目”研究的横断面数据,根据纳入、排除标准,排除出血性脑卒中、蛛网膜下腔出血及其他脑血管病患者,最终纳入72
酰基腙分子光开关现已经被广泛应用到超分子自组装,材料科学,信息储存等重要领域。尤其是二吡啶类酰基腙衍生物,因其独特的N-N=C片段以及在该片段上多个质子的存在,使得这类衍生物可以作为良好的异位离子对吸附器来捕获离子对,并在光照的条件下可以对离子进行捕获或释放。但是,在以往的报道中,关于酰基腙分子具有异位吸附离子对性质的文献却很少,这是由于这类分子光开关的E/Z型异构体的吸收光谱无法产生有效的谱带分
目的本研究主要探讨老年人群空腹血糖与全因死亡和特定原因死亡的关联,并进一步阐明空腹血糖与其他影响因素的联合作用对全因死亡和特定原因死亡的影响。方法通过收集河南省新郑市2011-2019年60岁及以上老年人群的居民健康档案数据来构建纵向体检队列,根据纳入排除标准筛选出本研究的研究对象。通过问卷调查、体格检查、实验室检查和辅助检查收集体检信息,通过死亡登记卡获得死亡信息。采用t检验、χ2检验、Mann
超声滚压加工是一种十分有效的表面光整加工技术,通过该方法能够改善材料表面完整性,为材料表层引入残余压应力,提升材料抗疲劳性能。本文采用试验的方法测定了18CrNiMo7-6材料的本构模型参数,建立了轴类件表面超声滚压有限元仿真模型;针对平面类工件表面超声滚压加工,基于弹塑性力学和赫兹接触理论建立了表面粗糙度和残余应力解析模型;最后采用试验方法对模型的有效性进行了验证。本文所做具体研究工作由以下几个
风能、太阳能、潮汐能等可再生能源大规模使用时,会面临能源时效性问题。发展无污染、高效的储能设备是解决可再生能源时效性问题的关键。高性能锌-空气电池具有能量密度高、无污染和电解液安全等优点,其开发利用是清洁、高效储能领域重要的研究方向。析氧反应(OER)和氧还原反应(ORR)是锌-空气电池在充放电过程中其空气阴极的基础反应,其动力学缓慢,因此设计开发高效ORR和OER双功能电催化剂是提升锌-空气电池
工业建筑遗产见证了人类工业化文明的进程,从二十世纪五十年代开始,欧美国家已经开始了对工业建筑遗产的保护再利用研究,出现了许多可以借鉴的优秀案例。近年来,我国日益重视工业建筑遗产的保护与再利用,比较成功的案例有中山岐江公园、北京798艺术区、成都东郊记忆、黄石国家矿山公园等。本论文是对开封近现代工业建筑遗产进行调查和研究,开封是著名的“八朝古都”,下辖5区、4县,1982年,被国务院公布为历史文化名
背景和目的:近年来,甲状腺癌(Thyroidcancer,TC)的发病率不断上升,已成为内分泌系统中最常见的恶性肿瘤,而分化型甲状腺癌(Differentiated thyroid carcinoma,DTC)是最常见的甲状腺癌组织学类型,约占甲状腺癌的90%。通过手术切除、甲状腺素抑制治疗、放射性碘131治疗等标准治疗手段,大多数DTC患者预后良好。然而,有报道证实,近三分之一的DTC会出现颈部
五配位磷化合物作为化学反应或生命进程常见的中间体或过渡态,受到了广泛关注。但由于五配位磷化合物的不稳定性,阻碍了对其性质的进一步研究。而五配位螺磷烷因为含有两个刚性环,能较好地稳定五配位磷化合物,所以可以作为五配位磷化合物的模板分子对其进行较为深入的研究。但到目前为止,关于五配位螺磷烷的研究多集中在理论和合成应用方面,对其亲核取代反应的研究较少,更不用说对其立体化学机理的研究。氢膦烷是一类特殊的螺