基于XML直接映射和间接映射的RDF构建方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:qq1036191963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义Web是基于图和“链接”的组织方式,但是所链接的不再是网页而是客观世界中的实体,实体之间的链接也被增加了语义描述。RDF是语义Web中用于组织语义化数据的数据模型,RDF Schema通过定义RDF使用的词汇为其赋予语义。知识图谱作为语义Web发展的产物成为了研究的热点,知识图谱中将三元组称作为知识。RDF通过聚合大量的知识实现快速响应和推理,已经被广泛地应用到智能领域作为数据组织的方式。Web中存在大量不同结构形态且没有语义信息的数据,基于这些数据构建RDF或知识图谱已经成为了一个重要的研究方向。XML是Web中统一的数据存储和交换格式,以XML描述的数据广泛存在于Web中,已经有一些工作致力于研究基于XML构建RDF的方法,但构建效果不甚理想,综合分析现有方法发现有以下几点不足:映射规则不合理,不能真正反映数据蕴含的语义信息;可处理的XML类型单一,方法的通用性和可移植性较差;未能有效识别等价元素,无法避免所构建的RDF出现冗余。本文基于已有方法的不足提出基于XML直接映射和间接映射的RDF构建方法,并在实验的基础上验证两种映射方法相较于已有方法的优势。具体研究内容如下:⑴提出对XML中的元素进行分类和聚合的概念。按照XML元素的嵌套结构定义其对应的三种子模型。XML中每个元素都可以视作是对现实世界中具体对象的描述,将标签名称相同的元素聚合为同一聚合类。对聚合类中元素的嵌套结构进行聚合获得该聚合类的抽象结构模型。⑵在XML元素分类和聚合的基础上设计基于XML直接映射构建RDF的映射规则和映射算法。该方法从两个层面进行RDF的构建:第一层基于XML元素的分类和聚合构建RDF Schema;第二层基于第一层实现XML向RDF的直接映射。在每一层中都设计了相应的映射规则和算法,在第二层中对XML中的等价元素作标记,等价元素在RDF构建过程中只映射一次,从而避免所构建的RDF出现冗余。在公开数据集上测试所设计的原型系统,通过分析实验结果验证该映射方法相较于已有方法的优势。⑶基于所设计的映射语言X2RML提出基于XML间接映射的构建RDF的算法,所设计的X2RML是对R2RML的继承与发展,相对于R2RML中的逻辑表,X2RML中使用XQuery查询获得的XML元素集被定义为逻辑树。对X2RML映射文档解析并对其中的不同的组件设计相应算法模块将逻辑树的相应部分映射为RDF三元组的不同组成部分。依据映射算法设计原型系统,使用相关实例对算法进行测试,验证算法的有效性。
其他文献
作为义务教育阶段中的重要科目,数学产生的教育影响重大。它不但影响学生理性思维的建立,还为后续理科科目的学习奠定坚实的基础,具有重要影响。“顺学而导”理念的教育重心在于锻炼和提升学生的数学思维,逐渐引导学生掌握正确的学习方式,消除学生的数学抵触或者惧学心理,借此提升整个数学教学的有效性。因此,在实际的教育教学中,教师应当注重这一理念的深入,结合学生的发展需要进行教学革新,深化这一教学理念的教学效用,
期刊
近年来,深度学习在计算机视觉领域取得了显著的成果,特别是卷积神经网络被成功应用于各种图像分类和视觉识别任务。但是深度学习在各种应用场景上的有效性很大程度上依赖于大量的标记数据,无监督域适应已经被证明是一种有效的方法去解决一个新的无标签域上的任务,其主要思想是减少源域和目标域的差异,利用标记的源数据集和未标记的目标数据集为目标样本训练强大的分类器。现有域适应方法在进行特征空间对齐的时候只进行了边缘分
学位
社交媒体的普及改变了人们分享和获取信息的方式。任何人在任何地点,只要拥有一台可以连接互联网的终端设备,就可以实时地跟踪热点新闻,分享自己观点看法。社交媒体在给人们带来便利的同时,也使得大量虚假的谣言能够在互联网上广泛的传播。社交媒体谣言不但会误导大众,而且会对社会和国家造成危害。目前,社交媒体谣言检测方法主要是基于帖子的内容和用户评论数据判断发布的帖子是否为谣言,本文分别针对这两个方面提出了不同的
学位
RDF(Resource Description Framework,资源描述框架)是用于描述互联网资源的通用框架。针对普通用户对RDF数据的搜索,由于用户不了解RDF数据概况以及用于查询的结构化语言又相对复杂,因此从RDF数据中搜索出目标资源对于普通用户而言是较为艰难的任务。面对用户不了解目标领域或者搜索任务相对困难的场景,探索式搜索成为普通用户搜索RDF数据的有效方法。随着RDF数据规模的日益
学位
数学是小学阶段一门重要的基础学科,新课程要求教师不仅要注重数学知识的传授,同时还应该关注学生的数学思维和能力发展,让学生掌握数学学习的有效方法和思想。这就要求教师打破传统教学模式,树立以学生为主体的教育理念,并给学生提供自主思考、合作探究的平台,教师则发挥引导作用来指导学生学习,成为学生数学学习的合作者和引导者。顺学而导理念刚好能够达成这一目标,因此,在小学数学教学中,教师应该基于顺学而导的理念开
期刊
资源描述框架(Resource Description Framework,简称RDF)及其模式RDF Schema(统称为RDF(S)),是万维网联盟(World Wide Web Consortium,W3C)推荐的用于语义Web处理数据的通用模型。RDF(S)的构建以及存储对语义Web的发展有着重大的影响。因此,将不同类型数据源中的数据自动构建成RDF(S)以及对RDF(S)进行有效管理成为
学位
随着语义Web技术的快速发展与进步,资源描述框架(RDF)作为W3C推荐的一种元数据模型和信息描述规范,广泛地应用于各种领域中。RDF模型是一种简单且易扩展的数据表示方式,能够准确,灵活地表达Web数据中的语义信息。各种实际应用中都存在着大量的时态信息。Web中的数据事实也是动态的,具有一定的时效性的。为了跟踪Web数据随时间的变化,将时态信息引入到RDF的框架中。因此,研究者们提出了时态RDF模
学位
随着基于位置服务的普及和空间定位技术的发展,许多应用通过获取移动终端的地理位置,向用户提供位置相关的服务和查询。空间索引在空间数据库中起着重要作用,其性能决定了数据访问和查询处理的效率。空间数据规模越来越大,如何设计一种高效、轻量的空间索引结构,提高数据库吞吐效率,并且减小索引文件的存储成本,一直是空间数据库领域的一个热点问题。本文设计并实现了一种空间对象学习索引——SLI(Spatial Lea
学位
随着物联网技术和智能医疗的发展,无线人体局域网的出现给目前医疗系统对病人的实时监测和响应处理提供一种新的可能。智能医疗的发展离不开数据的感知和采集,有了无线人体局域网的出现,数据的感知与采集将会变得十分便捷。虽然无线体域网有着很好的应用前景,但如何保证医疗用户隐私数据的安全性、无线体域网高效可靠的身份认证和安全管理也成为目前亟待解决的问题。本文深入研究了体域网智能医疗系统的安全框架及身份认证技术,
学位
知识图谱的研究包括构建与应用,而知识表示与推理不仅是实体对齐、三元组分类等构建技术的基础,而且是智能检索、知识问答、推荐系统等应用技术的关键,因此知识图谱的表示与推理是贯穿知识图谱构建与应用的关键基础研究。知识表示与推理研究的主要目的是提升推理能力与计算效率。但目前的方法大多仅关注推理能力,增加模型参数以提升模型性能,却降低了推理效率。基于属性、规则等额外信息增强知识表示学习和推理模型,不仅能提升
学位