【摘 要】
:
随着信息技术的发展,人们可用的数据资源呈爆炸式增长。在面对这些海量数据时,用户需要有强大的检索工具来帮助自己找到所需的信息。开放域问答(Question Answering,QA)研究
论文部分内容阅读
随着信息技术的发展,人们可用的数据资源呈爆炸式增长。在面对这些海量数据时,用户需要有强大的检索工具来帮助自己找到所需的信息。开放域问答(Question Answering,QA)研究的目标是给人提供比现有搜索引擎更自然、更直接的信息访问交互界面,用户可以用提问的形式提出信息查询需求,系统能直接将答案和支持信息一起返回给用户。本文对开放域问答系统的最重要的三个部分:问题分析、句段检索和答案抽取进行了分别研究。在第二章提出了一种新的基于疑问词和焦点词词义的中文问题分类方法,首先利用CRF模型自动识别问题中的疑问词和焦点词,通过对疑问词和焦点词的词义消歧,获得它们在《同义词词林(扩展版)》上的三层到五层的词义,结合问题中的其它全部非停用词和词性,训练得到SVM模型来分类。实验表明,疑问词和焦点词特征的使用,显著提高了问题分类性能。在本文的第三章,对句段检索进行了研究,探索了一种新的基于词义分析的句段检索方法,取得了不错的实验效果。本文的第四章对问答系统中难度最大的一部分答案抽取和生成进行了研究。提出了一种新的基于语义角色标注的答案抽取技术,相关实验结果表明,利用语义角色标注的结果,同时结合词袋方法来选择答案句,能够显著提高系统的性能。最后,本文在第五章设计并实现了一个自动问答系统,并对这个自动问答系统进行了基本的性能评测。
其他文献
随机规划是含有随机因素的一类不确定规划问题,它广泛存在于工程实际中。其传统的求解方法是针对某些具有特殊结构的随机规划问题,将其转化为确定性等价类,再用已有的确定性
细分造型方法的实质是通过对初始控制点或者初始网格进行一系列的细化过程,细化的极限生成所需要的曲线或者曲面。细分是生成任意拓扑曲面强有力的方法。细分算法的最大优点
由于Web上海量的信息处于不断的变化中,通用搜索引擎己经很难再为用户提供一个全面并且更新及时的信息搜索服务,其局限性在于它试图索引全部Web并且试图服务于所有主题的查询
网格和P2P计算是当前分布式计算领域的两个研究热点。网格是即因特网和万维网之后的新一代的网络应用,试图实现互联网上所有资源的全面连通,将互联网上的资源整合成一台超级
解决图中受顶点数限制的最短路径问题在交通工程、通信网络等方面有重要的实际意义。本文主要是针对K顶点数限制最短路径问题提出求解算法。在实际应用中,除希望得到最短路径
微粒群算法最早是在1995年由James Kennedy和Russell Eberhart共同提出的,其基本思想是受对鸟群行为进行建模和仿真的研究结果启发。微粒群优化算法是一种基于种群搜索策略的
下一代搜索引擎的一个突出特点是个性化,个性化信息检索是以用户为中心的信息检索技术,它获取以多种形式表达的用户需求(包括显式的、隐式的以及相关用户的需求),并综合利用
近年来,随着音视频数字产品的不断呈现,使得视频信息使用量将大于静态图像使用量,从而视频数字产品的安全问题如数字版权问题日益突出。通过数字水印技术可以有效起到版权保
随着网格技术的深入研究与发展,地理上分布的异构资源可以通过网格工具整合成一个完整的计算平台,而高效的网格任务调度则成为研究的热点和亟待解决的问题,其难点在于综合考
近年来,随着社会经济和工业技术的高速发展,各行业对电力系统提出更高的要求,所以,电力系统高效稳定运行,已经成为各行业发展的基础。配电系统作为电力系统中与用户联系最直接的环节,其智能化的发展更为迫切,与此同时电力系统中装置的发展也要趋于网络化、智能化。而其中微机保护装置更是保证整个智能化配电系统供电稳定、可靠运行的重要组成部分。本文通过分析国内外智能化配电系统及其微机保护装置的现状,根据微机保护装置