面向自动问答的中文词义消歧和问题理解

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zqh88211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的迅猛发展和在日常生活中的广泛应用,人们在各行各业都在寻求人工智能的帮助。而在客户服务、人机交互等领域,自动问答是不可或缺且亟待突破的问题之一。其中,面向开放领域的自动问答更是受到了广泛的关注。在自动问答问题中,需综合多种自然语言处理的具体任务和技术,因此自然语言处理各项任务的效果提升和这些技术的结合方式是研究的两个重要方面。本文即研究了自动问答背景下的两种自然语言处理问题,并结合这些技术研发了一个自动问答原型系统。首先,论文研究了基于LSTM的中文词义消歧技术。无论是在中文还是外文中,一词多义现象都是广泛存在的,如何利用上下文确定多义词的语义是亟待解决的问题。本文创新性地提出了一种基于同义词替换的词义消歧策略,将问题转换成了文本分类问题。本文根据此策略构建了词义消歧数据集,并设计一种基于LSTM的文本分类模型对转化后的分类问题进行了解决。实验结果表明,此模型在数据集上训练后成功收敛,分类正确率达到78%,与其他对每个词语都训练一个模型的方法效果相当。第二,论文研究了面向自动问答的问题理解技术。在进行自动问答时,理解用户的问题,正确了解用户意图是十分关键的步骤。本文在使用同义词替换策略的基础上,创新性地提出了一种基于Hownet的词义相似度计算方法,通过结合词语编辑距离和词向量余弦值,提出了词语“综合相似度”的度量方法。将此度量方法应用到自动问答的属性匹配问题中,结合实体链接技术完成了自动问答的整体算法。实验结果表明,应用此度量算法后自动问答的F1值达到0.83,印证了综合相似度度量方法的可行性和有效性。最后,基于微信公众平台搭建自动问答原型系统。自动问答系统虽面向开放领域,但其功能总归是有限的。本文从实际出发确定自动问答的功能范围,设计并实现了一个自动问答系统原型,并将其部署在了微信公众平台,实现了微信公众号的自动问答。经过测试,此系统很好地完成了自动问答系统设计的所有功能。
其他文献
垃圾渗滤液是污水处理行业常见的高浓度有机废水,必须经过处理降低渗滤液中的有害物质,达到排放标准才能排放。当采用上流式厌氧污泥床反应器(UASB)处理渗滤液时,发现在厌氧处理构筑物及其附件内会产生大量的结垢物,经过检测与分析这些结垢物的主要成分为碳酸钙。结垢物的生长速度较快,需要及时清理。目前常用的除垢方法是物理清除法,但这种方法不仅需要反复定期清理,还需要大量的人力和物力,操作过程需要消耗一定的时
目的脑出血是致残率、致死率最高的一类卒中亚型,卒中相关肺炎是脑出血后常见并发症之一。大量研究证据显示,卒中相关肺炎的发生不仅增加了患者住院时间和医疗费用,而且大大
会议
水垢沉积一直是困扰锅炉、冷却塔等热交换设备的主要问题。水垢的大量存在,不仅会加速管路内壁的腐蚀、降低热交换率、严重时会导致管内压增高甚至引发爆炸等一系列安全事故。电场阻垢法是一种有效的基于物理场的阻垢方法,具有高效、环保、成本低等优点,目前该技术已经得到了广泛应用,其机理主要为电场影响了碳酸钙的成核及结晶过程,并最终抑制水垢的沉积。但是,在实际的应用工况下,水中往往含有大量的杂质镁离子,而镁离子的
文章主要讨论了可积晶格方程的Hamilton结构的建立、无穷守恒律的获得、可积晶格方程族的可积耦合系统、非等谱形式以及Darboux变换的构造和应用.第一章,概述了孤立子理论的
经典的土压力理论,因其力学概念明确、计算过程简单,在工程实际中得到了广泛的应用。然而在工程实际中,土体往往达不到极限状态,经典的朗肯理论和库仑理论已不能满足实际工程的需要,因此研究非极限状态下的土压力具有重要意义。首先,利用有限元软件ABAQUS模拟了基坑开挖过程,得到了不同工况下支护结构上的位移变化规律和土压力变化规律,证实了在静止状态与主动状态之间确实存在着非极限状态,且非极限状态随着位移的变
随着传感器技术、通信技术、计算机技术等的蓬勃发展,人们每时每刻都能获得海量数据。然而,由于这些数据往往是大规模、高维且含有噪声,甚至是有缺失的,因而产生了诸如数据存
离子液体克服了很多传统有机溶剂的缺点,作为一种“可设计性”溶剂,具有很多优点,发展潜力极大。其中,结合了离子液体“可设计性”和表面活性剂双亲结构的两亲型离子液体,是一种新兴的,符合“绿色化学”理念的物质。本文选用具有表面活性剂和离子液体特性的新型离子液体—两亲型离子液体四丁基膦氯合氯化铁盐和十四烷基三丁基膦氯合氯化铁盐([P4444]FeCl_4和[P44414]FeCl_4)。[P4444]Fe
随着计算机的广泛使用,机器翻译已经从自然语言处理领域逐步应用于多个领域,例如工业领域,教育领域等。由于人们对多语言之间翻译的需求日益增加,因此有效的提高文本的翻译质
纠错码是提高信息传输效率与可靠性的重要工具.构造性能良好的线性码类是纠错码研究中的一个基本问题.随着有限交换非链环上纠错码理论的发展,越来越多的编码学者开始研究有限非链环上的线性码.本文研究有限非链环Fq[v]/(vm-v)上线性码的结构性质,主要包括:有限非链环Fq[v]/(vm-v)上常循环码和几种自对偶常循环码的代数结构;有限非链环F2+vF2上几类线性码基于Chinese Euclidea
海冰是极地和中、高纬度地区经常发生的海洋灾害之一,它的冻结、融化和漂流会对沿海地区、海洋上的生产作业产生重大影响。当某些海域发生大面积海冰灾害时,会对近岸港口、沿岸海产品养殖、航海船只和海上资源开采平台造成巨大的损失。因此,为了快速准确地评估海冰冰情,及时预报海冰灾害,确保人身财产安全,海冰检测研究具有重要的意义。相对于传统的海冰检测方法,遥感海冰检测技术能够提供全天候、大面积、准确的海冰信息,已