面向开放域的问答系统答案获取技术研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:sadiori1383
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答系统允许用户输入自然语言问句,并返回简洁而准确的答案,相对于搜索引擎输入关键词并返回文档列表的工作模式,既有利于用户更清晰地表达检索意图,也具有更高的效率,在一定程度上更能满足用户信息检索的需求,是信息检索领域的研究热点之一,尤其是基于互联网的开放域问答系统,具有重要的理论研究意义和实际应用价值。本文主要结合现有的研究和技术成果,在开放域问答系统的查询扩展、信息检索和抽取以及答案质量评估排序等方面进行了研究,研究成果如下:1.设计了基于Wordnet扩展的查询构建方法,针对搜索引擎的特性和问答系统的需求,利用同义词典Wordnet对问句的关键词进行合理扩展;2.提出了基于多特征融合的文本相关度的信息抽取方法,通过结合多种形式的特征,用机器学习的方法对文本相关度进行计算,从而实现候选答案的抽取;3.提出了基于相似支持集的答案质量评估方法,以相似历史问题对应的高质量答案为支持集对候选答案质量进行间接的计算,避免问题和答案之间巨大语义距离造成的影响,从而提高答案质量评估和排序的有效性;4.运用本文提出的相关模型和技术,设计并实现了一个面向互联网真实用户的开放域问答系统,并通过实验证明了各模块的有效性和系统的可用性。
其他文献
2003年3月,联合视频工作组JVT(Joint Video Team)正式提出了新一代视频压缩标准。由于其相比以往标准的出色的性能,被人们称为新一代视频编码标准。H.264/AVC标准支持从低带
随着高性能计算应用领域的不断增加和数字化信息规模的不断扩展,使得存储系统在高性能计算机中占据了越来越重要的地位。同时对存储系统的性能也提出了更高的要求,主要包括:
伴随着社会经济的飞速发展,信息技术的不断进步,决策所涉及的系统越来越复杂,要考虑的因素越来越多。然而,传统的决策方法已显得力不从心,所以,决策者们迫切希望能够借助计算
随着网络技术的飞速发展,人们对于分布式计算的需求不断提高,新的计算模式不断出现,“云计算”作为一种新兴的分布式计算模式,受到了人们的普遍关注,但相关技术尚不成熟,无统一的标
乘客信息系统(PIS)是城市轨道交通的重要组成部分。目前,国内的相关研究和应用处于起步阶段,广泛采用的PIS信息组播方案有一些共同的缺点:视频采编、下载播放的软硬件成本高;不能
基于网络的信息交换为多媒体数字作品的使用、传播提供了便利的途径,然而由于数字作品极易被非法复制和篡改,使得数字作品的信息安全和版权保护成为迫切需要解决的问题。因此
基于内容的图像检索是为了提高图像检索的效率,将数据挖掘中的分类技术应用于基于内容的图像信息挖掘领域。图像检索系统的最终用户是人,因此从心理学角度来捕获人对图像内容
数据挖掘技术通常由机器学习、数据库和统计理论等技术相结合进行挖掘,是从许多较复杂关系的实际数据中,提取有潜在价值的数据信息的非平凡操作。粗糙集理论建立在对象里不可
目前,遗产信息系统之间普遍存在着一定的互联、互通、互操作的问题,而在信息系统综合化过程中,对现有的遗产系统进行系统集成是一种重要手段。Agent技术因其自治性、智能性等
无线传感器网络是一种由大量多跳的传感器节点构成的自组织网络,在环境保护、灾害监测和军事防御等领域有很大的应用潜力。在采用传统的分层网络体系结构下,MAC层协议在无线