数据仓库中基于本体的数据集成研究与应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:jkhy66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库中现有的ETL方案只能在语法和结构层次上进行数据整合,无法完全解决数据的共享、重用以及语义上集成的问题;ETL的过程非常繁琐,没有智能化,工作量巨大;由于语义异构的处理难以实现,造成集成的数据质量较差;现有的ETL方案还将使后续的ETL开发人员对ETL的过程设计、编写程序和建立流程的质量与可靠性产生怀疑;传统的ETL活动是按照设计者的思想理解将数据集成到数据仓库中的,由于没有统一的标准,与其他数据库系统不兼容,扩展性、重用性较差,势必会造成新的“数据孤岛”。由于本体具有准确的表达概念语义的能力和很强的推理能力,通过使用本体生成的映射规则来指导ETL,避免了传统集成方式的缺点。因此利用本体指导数据仓库的构建已经成为数据集成的趋势。针对上述问题,本文介绍了数据仓库中一种基于本体的异构数据集成方案,重点解决了集成中的语义异构问题。本文提出了数据仓库中基于本体的异构集成框架,其主要内容如下:研究了基于业务的应用领域词汇库构建方法,提出了基于共享词汇库的半自动标记数据模式算法。共享词汇库统一了领域内各数据源的语义信息,文中设计了根据应用领域共享词汇库从各个数据模式提取应用本体的方法。本文研究了本体的映射和推理过程,设计了基于本体层次结构的自动ETL生成过程。最后,将提出的数据仓库解决方案应用于“数字海洋”领域,并通过建立海洋水文学科BT和CTD子学科本体,验证了文中所提出方法的有效性和可行性。结果表明,通过构建领域术语与用户交互,能够让用户积极的参与到系统的建设中;利用共享词汇库标记数据存储可以有效的解决数据仓库构建的语义异构问题,统一语义一致性;通过本体映射推理可以很好的对本体结构进行验证,并发现本体中的隐含信息;通过本体指导的ETL过程,解决了传统ETL过程的不足,为数据仓库建设者与用户的交流提供了参考,提高了系统分析和建模的效率
其他文献
随着劳动力的大量流动,越来越多的随迁子女到流入地接受义务教育,使得流入地的财政压力越来越大,这就需要合理划分各级政府的财政责任,构建相对集中的义务教育经费统筹机制和
地理案例教学是基于老师的指导,利用与实际生活有紧密关联的典型案例,积极引导学生对地理案例展开全面深入的研究探讨,从而实现学生地理实践能力的提升,培养学生发现问题解决问题能力的一种教学模式。新型案例教学模式更能有效满足教育体制改革创新发展的需求,对现在中学地理基本理论知识的教育培养有比较重要的推广意义。笔者在三年地理教学中发现了蒙授地理3案例教学中存在的一些问题。高中地理新课程改革在天山二中开展已经
神经肽Y(NPY)是由36个氨基酸残基组成的神经活性肽,广泛存在于神经系统组织内。本文通过对78例急性脑血管病患者血浆NPY进行测定,探讨神经肽Y在急性脑血管病中的临床意义。
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的评价郑启仲教授清漾汤颗粒治疗气虚痰瘀证儿童原发性单纯型肾病综合征的临床疗效。方法将72例原发性单纯型NS患儿随机分为对照组和治疗组各36例。治疗组采用清漾汤颗粒+
改革开放的大潮促进着各行各业的迅速发展,街头食品摊点也不例外,它作为商品经济的一种补充形式,为企业和社会的富余人员找到了就业门路,缓解了某些社会矛盾也带来了许多问题
不同干扰下,正交幅度调制(Quadrature Amplitude Modulation,QAM)的解调性能受到的影响不同。通过建立QAM在干扰下的系统模型,推导出一定条件下使得QAM解调性能最差的干扰信号
利用手机摄像头,通过改变摄像设备的焦距,对比两幅不同焦距下图片的模糊度,精确计算目标物体的距离,该方法同样适用于立体物体的距离测距。该方法将被测区域的图片量化为81个
法律案例教学是一种有效的教学手段,能够直接、客观地反映法学课程一般原理和主要内容。以《侵权责任法》为例,通过案例教学,引导学生在课堂讨论、分析具体案例,充分发挥学生