问答系统中多变量问题到OWL查询语句的转换研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:tinnawang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尽管搜索引擎极大的方便了人们在Web上进行信息查找,但其还是有着很多的缺点。问答系统以其符合普通用户习惯的表达方式、返回简单准确的答案弥补了搜索引擎的不足,成为信息检索技术中的研究热点。随着Web智能特别是语义Web相关技术的发展,OWL成为W3C的推荐标准,网络上存在大量的OWL知识,以问答的方式检索这些知识是更好的利用这些知识的方式之一。   现有的OWL知识问答系统依然存在一些问题,如对OWL元素的处理不全面,不能处理多变量问题等。针对这些问题,本文集中研究问答系统中多变量问题到OWL查询语句的转换方法,包括三个子问题:期望答案类型识别、变量提取、组合OWL查询语句,具体工作如下:   针对期望答案类型识别,在参考Webclopedia的期望答案类型分类标准后,本文根据实验所采用的领域知识库,总结出以“Who”,“When”和“Where”开头的问题的期望答案类型。对于以“What”和“Which”开头的问题,则提出先识别问题的目标,再根据问题目标来得到问题期望答案类型的方法。对以“What”和“Which”开头的问题进行的实验结果表明该方法具有较好的效果。   在变量提取方面,提出了一种提取变量、识别变量潜在类型的方法。该方法采用Stanford Parser工具对问题进行解析,若解析结果表明问题中含有从句则提取变量,变量的潜在类型通过关系词所指代的先行词直接得出或从用同义词典对先行词进行扩展后得到的集合中得出。实验结果表明该变量提取方法是可行的。   在组合OWL查询语句方面,为了组合所有的变量及OWL元素到RDF元组,采用了基于模板的组合方法,组合过程中用到了Agile系统没有用到的二变量模板。得到RDF元组后,为了剔除元组中的噪声,对Agile系统中已有的噪声剔除规则进行了部分修改。实验结果表明基于模板的组合方法能够较好的组合RDF元组,噪声过滤能提高组合精度。   综合前面描述的期望答案类型识别、变量提取、组合OWL查询语句三个子内容的所有实验结果,整个结果表明方法对以“What”,“Which”,“Who”,“When”开头的问题比较有效,对以“Where”开头的问题效果较差。
其他文献
软件维护活动是软件生命周期中时间跨度最长的一个阶段,在软件开发过程中变得越来越重要。其中,维护工作的效率很大程度上依赖于技术人员对软件的理解。程序理解技术是通过计
随着计算机的普及和计算机网络的使用,计算机越来越多地服务于人们的生产和生活。主机与网络安全成为人们关注的重要问题,进程是计算机系统的主体,目前许多网络攻击手段都是通过
学位
随着现代科学技术的发展,脑成像、脑电技术设备等相关科学手段和分析方法的相继出现,人脑逐渐由“黑盒”变成“灰盒”。这为我们的科学研究提供了技术前提。最近许多学者认为建
学位
普适计算是信息空间与物理空间的融合,在这个融合的空间中人们可以随时随地和透明地获得数字化的服务;普适环境中上下文感知系统成为新兴的研究领域。而作为上下文感知计算的核
学位
科技文献是由文章的作者、标题、摘要、子标题、正文和参考文献等内容组成的,这些内容构成了科技文献的结构化特征。现有的科技文献检索系统都是基于关键词的检索,就是指将科
学位
手语是听力障碍者的第一语言,在听力障碍者之间及他们与健听人交流时被广泛使用。由于听力障碍者很难形成完整有效的书面语言能力,因此创建具有普适能力的手语合成系统具有很强
学位
机器人足球比赛已经成为当前人工智能和机器人领域的研究热点之一,其中,全自主足球机器人有着巨大的应用潜力,其应用领域包括自动驾驶、导游、未知区域的探索、核电站的维护
随着Andriod系统的流行,越来越多的开发者从事Android应用的开发并设计出了大量优秀的Android应用,这些应用满足了用户的各种需求。随着开发能力的提高,对移动设备性能有较高
针对连续型变量与离散型变量的多目标优化问题,分别提出基于博弈策略的多目标粒子群优化算法和面向旅行商问题(TSP)的协同进化粒子群优化算法。围绕群智能算法的优化原理与多
RDF数据是语义网上的一种重要数据。它们之间的关系需要推理机进行推理才可以获得,但是由于语义网上的RDF数据量规模性较大,语义网上传统的推理机不能很好处理这种大规模数据
学位