列表类自动问题问答系统的设计与实现

来源 :复旦大学 | 被引量 : 0次 | 上传用户:Melaniemei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们已经进入了一个信息飞速发展的时代。面对排山倒海的文字信息,如何从中找到问题的确切答案成了一个重要的研究课题。自动问题回答系统是能够根据用户输入的自然语言问题返回确切答案的系统。由于问题的答案往往不止一个,因此如何在非结构化的文本语料中寻找到尽可能多的正确答案是一个非常重要的研究课题。本文首先阐述了列表类问题回答与一般问题回答的区别,列表类问题要求返回尽可能多的正确答案,且答案的个数不确定,然后针对列表类自动问题回答的任务要求及这些特点,设计了一个列表类问题回答的框架并实现了一个列表类问题回答系统。该系统在问题分析答案分类过程中,抽取问题中的关键词并根据该关键词来对答案类型的所属进行分类;在文档检索中系统采用一种基于短语的检索模型,灵活有效地调节查询词的长度与权重,来提高文档检索的性能;在答案排序中,提出了一种基于答案与上下文中词的距离的排序模型来对最终答案进行排序。本文提出的框架在一定程度上解决了如何在返回尽可能多的答案的同时保证答案质量的问题。实验结果表明利用这些模型与算法的列表类问题回答系统与baseline系统相比,性能有显著的提高。
其他文献
随着网络的飞速发展,对某一个问题,如何从海量的非结构化信息中找到合适的答案已越来越受到人们的关注,问答系统因此应运而生。人们期望它将来能够完全或者部分取代现在基于
等值线的生成、光滑和标注是生成等值线图的三个主要环节,本文对基于矩形格网的等值线追踪与生成、光滑和标注等算法进行了研究和实现。 首先,本文改进了基于矩形格网等值线
生物免疫系统与计算机入侵检测系统具有惊人的相似性:前者保护生物机体不受诸如病菌、病毒等各种病原体的侵害,后者保护计算机系统不受或少受入侵事件的危害或威胁,两者都是在不
随着网络技术的不断发展,网络速度越来越快,网络安全问题也随之变的更加突出。传统的网络入侵检测技术的局限性越来越明显,已经无法适应网络新攻击层出不穷和数据量日益增大
计算机网络和通信技术的发展不断改变着人们工作和生活的方式。具有更大带宽、融合诸多类型有线和无线网络的下一代互联网NGI (Next Generation Internet)为人们提供了更灵活
在很多嵌入式系统应用系统中,都需要把一个实时系统和一个非实时系统安装在同一个嵌入式设备上,让它们一起工作,发挥各自的优势。这篇论文讲述了RT-Hypervisot这个实时虚拟机
学位
为了在异构网络中实现不同接入设备对视频流数据的访问,通常要求视频服务端的编码器提供不同分辨率的压缩码流。双流视频编码器能够实时生成两种不同分辨率的码流,但是传统双
该论文提出了一种分布式并行遗传算法,并用Java语言开发算法程序在Beowulf机群系统上加以实现。论文首先搭建了廉价的Beowulf机群系统作为课题的硬件环境。并行遗传算法使用J
随着计算机软硬件水平的快速发展以及各种移动终端智能设备,如智能手机、数码相机等的出现,人们在互联网上上传和分享图片变得越来越容易,这就导致了互联网上多媒体数据总量