语义数据上使用混合图的快速有效的关键字查询

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:makeitreal
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2001年万维网之父蒂姆?伯纳斯-李和他的同事在《科学美国人》上面发表的一篇科普性的文章《The Semantic Web》标志着语义万维网的诞生。语义万维网至今己经发展了十几年的时间。语义数据特点是结构和语义。常见的语义数据是RDF数据。结构化查询语言是访问语义数据的标准查询语言,例如SPARQL查询语言。怛是这种结构化查询复杂的语法阻碍了语义搜索的推广。普通用户习惯于使用简单的关键字查询。虽然它在表达能力上如结构化查询语言。但是因为它快捷方便的强人优势,使得被现有的搜索引擎广泛使用。  如果用户能使用关键字查询来访问RDF数据,可以使得用户不需要掌握学习曲线很陡峭的结构化查询语言,同时用需要理解复杂且可能快速演进的数据模式。在近几年中,把关键字转换成SPARQL查询得到了广泛的研究。现有的方法主要分为两类,一类是基于原始的RDF实例图的方法(基于RDF实例图方法),这类方法通常能得的准确的结果,代价是运行时间会很长。另一类是基于模式图的方法(基于模式图方法),这种方法能人人加快转换的速度,侃是通常精度会很低。在这篇论文中,我们提出了一个创新的方法,这种方法基于一个混合图,这个混合图能平衡转换的准确度和转换的效率。对于给定的RDF图,我们还定义了一个计分函数,这个函数能用来评估转换准确度和效率之间的权衡。这个函数能指导整个混合图的生成。在这个混合图h.我们实现了一个把关键字转换成结构化查询的框架。在三个不同类型的数据集上做了实验,实验表明我们的方法对于基于实例图的方法在准确性下降不多的惜况下效率是上有很大提升,对于基于模式图的方法在效率下降不多的情况下准确性有很大提升。
其他文献
近年来,随着新的数据采集方法的使用,产生了一种新的密集型数据集——数据流。由于数据流是连续、无限、随时间变化的数据序列,所以通常不便采用传统的数据库管理系统管理数据流
探地雷达技术是近些年来迅速发展起来的一门技术,它通过向地下发射高频电磁波来探测地下目标或地层结构。探地雷达属于一种较新的地球物理方法,在近10年的时间内逐渐的成熟起
随着嵌入式Linux操作系统数据处理能力、存储能力的进一步增强,嵌入式平台上的数据备份系统越来越受到人们的重视。目前在嵌入式Linux操作系统中提供备份和还原功能的都是软
增值业务计费系统是增值业务平台重要的组成部分之一,它负责收集用户使用增值业务资源和服务的相关数据,并利用这些数据完成用户使用增值业务应缴纳费用的计算,然后按照增值
稀疏算法是一类广泛存在于各类应用中的核心算法。在目前的高性能计算机系统上,稀疏算法的浮点效率经常不到10%,影响了高性能计算机计算能力的发挥。本文在传统应用领域和新兴应
随着科技的进步和人们生活质量的提高,人们对工作便利性的要求越来越明显,无线显示适配器应运而生。无线显示适配器可以摆脱繁琐的线缆束缚,满足人们便利性的要求;其视频监控设备
进程演算从20世纪80年代Milner的CCS交互模型开始已有30年光景.期间成百上千的模型和等价关系被提出来,研究也深入了相关的各个分支。但是在完备交互模型上研究计算理论是一
随着计算机信息技术的高速发展,企业级信息化管理系统的概念被越来越多人所熟知,大量软件系统暴露出不易扩展、维护困难的弱点。设计模式的出现有效的缓解了这个问题,通过学
多方协同应用涉及到多个主体、多系统间的流程协作与信息交互,并且一个完整的业务流程也有可能涉及多个子流程,因此多方协同应用的业务流程一般都非常复杂。而如今多方协同应
覆盖表生成是组合测试研究的热点之一,其中贪心算法因为生成速度快,生成的覆盖表规模小而得到人们青睐。目前研究人员已经提出了很多基于不同策略的贪心算法,如AETG、TCG、DDA等