FAQ问答系统中的问句相似度研究

被引量 : 0次 | 上传用户:nofeeling189
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
常问问题库是问答系统的重要组成部分。问答系统通过将常见问题及其答案存储起来,形成常问问题集,来提高类似问题的答案搜索与合成效率。FAQ在使用上,存在问题集的更新和匹配新问题两个主要的问题,而解决这两个问题的关键,则在于问题(或称问句)相似度的准确计算。本文主要针对FAQ自动问答系统中的问句相似度进行研究,利用中文问句和中文语言的特点以进一步提高问句相似度计算的精度,达到改善FAQ问答系统性能的目的。论文的主要工作如下:(1)现有文献中,问句相似度的计算主要借鉴普通陈述句的相似度计算方法,而普通陈述句的相似更多反映的是语句间语义上的匹配符合程度,而衡量问句间的相似性则须同时考虑问句及其答案句之间的相似程度,为此,设计了一种新的问句相似度计算方法。该方法不仅利用问句之间的语义和语法特征考察问句之间的匹配程度,还利用问句的问题类型等信息来间接刻画答案句之间的特征形象,从而获取问句的深层语义信息,以提高问句相似度计算的准确性。实验验证了该方法的有效性。(2)由于基于《知网》的问句相似度计算方法中,词语相似度计算方法是利用相同的处理方法来处理对义词反义词与同义词近义词,从而有可能导致截然相反的两个问句拥有很高的相似度。为此,设计了一种改进的基于《知网》的问句语义相似度计算方法,该方法中不仅能够处理中文词语之间的褒贬性,也能够处理中文词语与英文单词之间的褒贬性,其中,对义或者反义的词语对问句相似度计算结果都起着副作用,从而降低了相反的问句成为相似问句的可能。实验证明了该方法更加有效。(3)基于上述研究,给出一个FAQ自动问答系统的原型系统,包含本文的一些研究方法的演示,为今后更加深入的研究提供一个平台。
其他文献
鲍氏三女史是清代中期女性文学创作的一枝姐妹花。作为镇江文化望族——鲍氏家族的三位女作家,其父亲鲍皋是“京江三诗人”之一,母亲陈蕊珠也是镇江有名的才女,并有诗稿传世
莫里斯·赫伯特·多布是英国马克思主义史学派中声明显赫的经济史家,其学术研究继承和发展了马克思主义理论体系,研究理论突破了传统史学观念。多布善于采取独特的研究视角,从
西方侦探小说的汉译在中国翻译史上经历了两次高潮,一次是清末民初时期,一次是改革开放以后。其在中国文学史上产生了巨大而深远的影响。但对国内侦探小说的译介在翻译选材、
宋珏,一名瑴,号荔枝仙、浪道人等,明国子监生,是明末莆田最有名的一位才子。他裔出莆田宋氏大家族,宋氏家族在莆田的政治和文化上都起着举足轻重的作用。作为宋氏子孙的宋珏,
近年来越来越多的国内外学者热衷于研究中国古典诗词的意境。中国古典诗词最重要的特点就是丰富的意象和耐人寻味的意境。目前国内有很多学者致力于中国古典诗词意象和意境的
本文共两部分,第一部分绪论讨论本次研究目的和文献综述等。第二部分共分三章:第一章研究王思任的生平,对王思任的生平状况做了一个简单的梳理,交代了一下当时的社会背景和时代背
目的探讨中西医结合治疗肛周脓肿的临床疗效。方法选取我院2010年7月—2014年7月收治的66例肛周脓肿患者作为研究对象,按照随机数字表法将患者均分为观察组和对照组各33例。
本文首先讲述了四通道数字下变频器ISL5216的功能特点及设计要点,然后详细介绍了使用其进行FM解调和宽带信号解调的具体设计方法。
目的:分析不同抗生素治疗方案治疗轻度慢性盆腔炎临床疗效和经济成本。方法:选择2013年5月至2015年2月和平县妇幼保健院收治轻度慢性盆腔炎患者120例,随机分为A组、B组、C组