受限域问答系统问句分类方法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:wsf3344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受限域问答系统是自动问答系统的一种,相对于开放域问答系统更具实用性和可行性而成为自然语言处理领域的研究热点。受限域问答系统通常包含三个部分:问句分析、信息检索和答案抽取。问句分类是问句分析中的一个重要模块,对问句进行分类,可以减少检索范围而提高其效率,且类别信息可以指导答案抽取策略,因此问句分类的性能直接影响问答系统的性能和质量。问句分类包括问句预处理、问句表示、特征选取、特征权重计算、分类算法设计等处理流程,其中特征选取、特征权重计算和分类算法的设计是问句分类模块中的核心部分,本文主要做了以下研究工作。首先,本文提出了一种基于词关联网络的领域问句特征权重计算方法。该方法针对目前特征权重计算方法都是基于统计信息而不考虑语义信息的缺点,结合受限域的特点,利用《同义词词林(扩展版)》计算同类问句集合中词语间语义相似度,将语义相似度作为路径构建词关联网络,并根据网络系统中节点重要性理论与TF-IDF思想相结合计算领域问句特征的权重。其次,本文提出了一种基于改进的二次贝叶斯分类模型的领域问句分类算法。该方法采用句法信息和句法结构分析提取领域问句特征,针对受限域的特殊性对传统的贝叶斯分类器做出改进,结合基于词关联网络的领域问句权重计算方法对领域问句进行分类。最后,本文利用昆明理工大学智能信息处理实验室提供的旅游领域语料设计并实现多次对比实验,对提出的特征权重计算方法和分类算法进行了验证,并给出实验数据和评价结果。实验结果证明了本文方法的可行性。
其他文献
到二十一世纪,人类进入了所谓的后PC时代,嵌入式技术作为后PC时代的技术主力,得到了迅猛的发展。嵌入式技术以具体应用为中心,结合计算机技术和通信技术已经成为研究与开发的
随着互联网的日益强大,互联网上数据急剧增多,如何在海量的数据中快速准确的找到所需信息,就显得尤为重要,这就需要多模式串匹配算法。同时越来越多的人使用互联网就会使互联
近几年来,人们对数据采集技术有了较大进步,并且对处理技术理解的不断深入,以及在军事、金融物流、GPS定位、雷达测速、传感器网络WSN、隐私保护、无线射频识别RFID等领域的具体
虚拟现实技术目前已经广泛的应用到人类生活的各个领域,其开发的虚拟系统不仅能够更加逼真的反映真实的空间环境,还提供了良好的人机交互操作能力。虚拟校园网就是虚拟技术在数
随着科技的发展,当今社会的不安全因素越来越多,人们对安防系统的需求也日益增多。门禁系统和视频监控系统作为安防系统的重要组成部分,目前各自的发展已趋向于成熟,如何提高产品
计算机技术的迅速发展给地理信息系统带来了巨大的变化,随着空间数据量和计算复杂性的增加,地理信息系统所采用的集中式模式面临着诸多挑战。P2P技术作为一种新的分布式计算
视频前后景分离与合成是信息化生活的基本需求。本文深入研究了视频前后景分离与合成相关理论与技术,充分分析了视频前后景分离与合成需要解决的问题,并基于此设计并实现了一个
访问控制是国际标准化组织ISO在网络安全标准(ISO7498-2)中定义的安全信息系统的基础架构中必须包含的五种安全服务之一,它是实现既定安全策略的系统安全技术,管理所有用户的资
近年来,游戏和电影行业的快速发展使人们对高质量真实感图形的需求不断增加。因此,如何更逼真、更高效地绘制三维场景是当前真实感图形学研究的热点。为了提高光线跟踪的绘制
伴随着计算机技术、网络技术和远程通信技术的不断发展,电子交易得到急剧发展,电子交易中的安全问题也日益备受关注,对网上电子交易的安全与便捷提出了更高的要求。本文针对安全