移动问答系统中的问题理解研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:ak328
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的快速发展,越来越多的用户使用移动终端设备获取信息,这使得移动知识服务成为目前研究的热点及方向。传统的搜索引擎虽然能提供给用户信息,但存在返回的信息过多,信息不准确等问题。而且由于移动终端本身屏幕显示和操作不方便等限制因素,用户要快速、方便的获得精确的信息,变得更加困难。这些因素制约着移动知识服务的快速发展。基于以上问题,本文提出了建立移动平台上的自动问答系统来准确获取信息的的方法,自动问答系统允许用户用自然语言进行提问,同时也以自然语言的形式返回给用户简短精确的答案。在某种程度上,能弥补传统搜索引擎的不足。但是目前自动问答系统的准确率都不高,其主要原因是:由于中文语言的复杂性,系统无法正确理解用户的问题,也就是问题理解环节的效率较低,这严重影响了后续处理环节,最终导致整个系统的性能较差。所以对问题理解进行深入分析及研究具有重大意义。   为了提高问题理解的性能,本文以问题分类为重点,构建了面向领域的领域知识组织和领域知识模型,设计了问句类型分析流程,使用户的问句经过句型匹配,对问题进行分类,最终将问题表示成计算机易于理解的标准化形式。此外,还提出了问题理解的另一种辅助方法—根据用户检索日志分析用户意图,它基于以往相似类型用户的检索记录,利用语义相似词帮助用户重新构造检索词,消除歧义,快速理解当前用户意图。通过融合这两种方法的优点,最终达到快速、准确的返回用户满意的答案的目的,系统检索效率及用户满意度都会得到显著提高。   最后,介绍了以问题理解为重点的移动问答系统的系统框架、系统实现,并进行了实验,对实验结果进行分析和评价。本文的研究及其成果对于中文自动问答系统,特别是对于限定域自动问答系统具有一定借鉴意义。
其他文献
传统叙词表相关关系的构建多依赖于专业人员和编表人员的经验积累和领域专家的人工鉴别,而人的主观性容易造成相关关系不能全面揭示,这种情况的出现很大程度上由传统叙词表所处
文献资源共建共享是为解决图书馆有限的文献资源难以满足用户需求这一矛盾而采取的一种措施,各个国家根据自身现状分别建立了不同形式的共享网络。在我国,经过不断的摸索和实践
互联网的快速普及为社会发展提供不可或缺的媒介,网络正日益成为公众参与社会生活的主要场所。网民规模尤其是手机网民呈指数级增长,网络正成为人人共同拥有的信息平台,成为人人
随着Internet和信息技术的飞速发展,以及科研工作者对信息流通快速、高效的要求越来越强烈,图书馆的资源结构发生了很大变化。从20世纪末开始,大量的电子资源以不同的方式和途径
随着互联网用户规模快速扩大,网络不良信息泛滥,国家相关部委对此高度重视,要求基础电信运营商主动清理网上不良信息或链接.本文论述了互联网不良信息监控平台的系统架构、主
数字图书馆的出现给人们生活带来了极大的改善,它将图书信息进行数字化存储于计算机中,通过计算机网络进行传播,使得图书信息资源共享,这在人们的各个生活领域都起到了非常重
2010年发布的《国务院关于加快培育和发展战略性新兴产业的决定》指出:新材料是七大战略性新兴产业之一。它同众多新兴产业一起已经成为未来拉动我国经济发展的重要引擎。研
通过对雷电放电特性及泄放路径的介绍,结合实际测试,探讨导致雷击浪涌防护失效的因素;最后,提出PoE供电系统设备雷击浪涌防护可靠性应采取的措施和建议.
大陆规模最大、最具代表性的中国国际机床展CIMT2015(China International Machine Tool Show,CIMT)于4月20日在北京拉开帷幕。结合目前的节能议题,台湾贸易中心与财团法人中
技术标准在技术进步、产业发展、企业竞争以及国际贸易中都起着愈加重要的作用,并逐步成为产业竞争的制高点。与传统产业或成熟产业相比,战略性新兴产业更需要技术标准战略的引