【摘 要】
:
自动问答系统(Question Answering System,QA)与传统的依靠关键字匹配的搜索引擎相比,能够更好地满足用户的检索需求,更准确地找出用户所需的答案,具有方便、快捷、高效等特点。
【出 处】
:
沈阳航空工业学院 沈阳航空航天大学
论文部分内容阅读
自动问答系统(Question Answering System,QA)与传统的依靠关键字匹配的搜索引擎相比,能够更好地满足用户的检索需求,更准确地找出用户所需的答案,具有方便、快捷、高效等特点。 问题分类是问答系统所要处理的第一步,问题分类结果的好坏直接影响后续工作的进行。答案抽取是自动问答系统所要处理的最后一步,也是非常关键的一步。如果不能在答案抽取模块准确地抽取出正确答案,将极大地降低问答系统的性能。本文在对现有问题分类和答案抽取技术进行深入调查和研究的基础上,主要进行了以下工作: 1.为了深入理解并能从整体上把握问题的语义,得到问题的答案类型等相关信息,本文以知网为知识库,提出了基于知网的中文问题自动分类,并用最大熵模型构建了一个问题分类模型。实验结果表明,分类正确率和其他方法相比有较大的提高。 2.通过借鉴前人在答案抽取方面的相关研究成果,为了在语义理解的层面上进行答案抽取,我们以知网为知识库并利用句法分析的结果,提出了句法分析和知网相结合进行答案抽取的新方法,并重点以数字类问题进行了实验,取得了较好的结果。 3.答案验证能够对答案抽取的结果进行必要的校正和反馈,在有关研究的基础上,答案抽取的最后阶段引入了答案验证机制,并进行了初步的尝试。 4.在一个简单的问答系统上,对本文提出的方法进行了实现和测试,并对实验结果讲行了评价。
其他文献
粗糙集理论是一种处理不精确、不确定和不完备信息的数据分析方法,现实应用中数据的规模和复杂程度不断增大,限制了粗糙集理论与技术的应用和拓展。决策信息系统分解作为一种数
无线传感器网络作为传感器技术、微电子技术和无线通信技术相结合的产物,成为计算机科学领域一个活跃的研究分支,在军事和民用中开始得到广泛的应用。无线传感器网络由大量低
随着数据库技术的迅速发展和信息系统的广泛应用,企业管理效率提高的同时也促成了海量数据的积累,一些大规模的系统,如证券、银行和人口统计等系统的数据量甚至超过了TB级。
随着物联网日益普及,对智能终端、智能传感器等智能设备的需求迅速增长,嵌入式微处理器和嵌入式实时操作系统(Real-Time Operating System,RTOS)是智能设备的核心,物联网的应
在勘探开发技术领域,众多石油公司正面对着越来越复杂的地质情况、越来越繁杂的项目数据和以及越来越紧迫的决策周期。因此,调整业务结构,优化工作流程,大力提升信息化建设和
云计算是并行计算、分布式计算和网格计算的发展,使并行技术走进了人们的生活。云计算、个人高性能计算机(PHPC)等技术的深入发展,使许多技术人员开始从单机工作模式向并行计
随着信息技术特别是网络技术的发展,电子媒体的传播极为迅捷,人们越来越容易获取数字多媒体信息,与此同时,数字多媒体信息的版权、保密等问题也变得日益突出起来,因此,多媒体的信息
软件复用是目前解决软件危机比较现实可行的方法之一。构件及构件库的开发是软件复用的前提。实践中构件数量不断增加,构件也随技术发展而不断更新,如何实现对构件库中大量的
最近的研究表明在大规模程序中含有许多重复代码,它们中的大部分是由拷贝-粘贴行为造成的。这些重复代码不仅降低了系统软件的可维护性,而且会给软件引入大量的bug。然而,现
粗糙集理论作为智能信息处理新的研究热点,已广泛应用于众多领域,但其自身尚存在一些局限,对噪声数据非常敏感,数据分析过程中易丢失潜在有价值知识。针对标准粗糙集不足,将标准包