基于关系数据库的关联数据构建方法的研究

来源 :东北大学 | 被引量 : 4次 | 上传用户:sxkcykart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着万维网尤其是语义Web的飞速发展,网络上的数据资源在不断地增加,数据之间的互操作性变得越来越重要,整个Web正逐步发展成为一个巨大的整体数据空间。目前海量Web数据大都被存储在关系数据库中,这种形式的数据虽然能够被人们理解,但是机器却没有办法自动识别处理这种类型的数据,无法满足语义Web的需求。为了使存储在关系数据库中的数据更好地融入语义Web并被机器理解,从而更方便地被人们查询和使用,因此有必要将关系数据库中的数据转换为机器可理解的形式。本文在全面分析现有相关解决方案优缺点的前提下,提出了一种基于关系数据库的关联数据构建方法。通过采用提取数据库语义的思想,分析了关系数据库中各表的主外键之间的关系、外键与引用表主键的取值之间的关系以及主外键与表字段的包含关系等等,将关系数据库中的语义进行提取。在此基础上,首先,将关系数据库中的数据资源采用自定义的词汇表进行规范化描述;其次,给出一系列关系数据库向关联数据映射的规则,其中映射主要分为模式映射与数据映射两个部分,模式映射的目标是生成描述所构建关联数据的RDF词汇表,数据映射则实现将关系数据库中的实例数据映射为最终的关联数据,其中采用数据库中的主键为生成的实体进行URI赋值;然后,根据模式及数据的映射规则,给出了相应的模式映射算法以及数据映射算法;最后,设计实现了一个将关系数据库自动构建为关联数据的原型系统(RDB2LINKEDDATA),并通过使用不同类型及规模的数据集进行实验,验证了本文所提方法的正确性及原型系统的可用性。本方法能够正确地将关系数据库构建为关联数据,并在转换过程中充分考虑了数据库中隐含语义的提取、数据资源的规范化描述以及实体的URI赋值问题。生成的关联数据能够对数据进行整合,提高数据质量,有利于将各类数据、信息和知识链接起来,使互联网进化为一个富含语义的、互联互通的知识海洋。
其他文献
面对化石燃料的迅速枯竭和随之导致的环境污染等日益严峻的问题,发展清洁和可持续的替代能源迫在眉睫。氢能具有非常高的能量密度且燃烧产物无污染,是传统化石能源最为理想的替代品之一。在各种制氢途径中,工艺相对简单的电解水制氢技术被认为是当前最有实际应用前景的可再生能源转化技术之一。电解水技术能够大规模地制备高纯度的氢气,它涉及两个分别发生在阳极和阴极上的半反应,即氧气析出反应(OER)和氢气析出反应(HE
主宾易位句是现代汉语中存在的一种将主语和宾语互相易位后,句法仍然可以合法成立且语义基本相同的特殊句式。表面上该句式看似可以不受汉语语序的束缚,但是这种特殊性实际上
麦当劳自1955年5月15日创立后,在半个世纪的时间里迅速完成了全球化的过程,拥有超过32000家快餐厅,分布在全球121个国家和地区,成为全球最大的快餐连锁集团和食品集团,其完善
山地不同生境间存在明显差异,而作为山地重要的地形因子之一,坡向间接导致植物物种结构组成与分布,它通过影响地表所能接受到的光照辐射进而对土壤水分、土壤温度等生态因子
随着高校的持续扩招,高知识、高素质、高学历的人才越来越多,大量的优秀毕业生涌入社会。相对于毕业人数的增长,用人单位对人才的需求并没有发生多大改变,就业难随之产生,毕
目的探讨门诊分诊失误的原因以及对干预对策进行分析。方法选取2015~2017干预之前的门诊分诊20000人次作为对照组,干预后的20000人次作为观察组,统计出每日改号的患者的人次,
宝宝患先天性心脏病时常常会出现不适,又不能用语言表达,往往哭闹不休。要做好哪些家庭护理才能使先天性心脏病的宝宝健康成长呢?$$   因哭闹可加重心脏负担,作为家长应尽量
报纸
在我国社会转型的关键时期,由于农村地区巨大经济利益的驱动和农村基层政权组织涣散的影响,地方黑恶势力不断向农村基层政权组织渗透,并已经成为构建社会主义新农村进程中的
钢铁行业兼并重组是解决钢铁行业产能过剩和无序竞争,实现产业布局优化,促进产业转型升级的重要路径之一。钢铁企业通过联合重组,能够实现资产、资源、资本、设备、技术、产
英语专业学生的"中国文化失语现象"表现为,在表达能力上,学生母语文化的英语表达能力低下;在题材选择上,学生钟爱英美文化。导致这一现象的原因是,学生认知和习得母语文化的