基于语义增强的多轮检索式对话方法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:DragonJiang2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能领域的快速发展,人机对话系统可以与人类进行流畅的对话,使人从重复的工作中解脱出来,对人机交互方式的变革具有重大的意义,是人工智能领域以及自然语言处理中重要的研究任务。其中,检索式对话是对话系统的一个重要实现。与生成式对话系统不同,检索式对话系统模拟搜索引擎的工作方式,从答案集合中查找所需回复。根据对话历史的轮数,检索式对话可分为单轮检索式对话和多轮检索式对话。多轮检索式对话系统的目标是根据对话历史信息(Context)和当前问题(Query),从候选答案池(Candidate Answer Pool)中选出最合适的答案,形成流畅自然的对话。多轮检索式对话系统是人类在探索类似人类智能的机器或系统的过程中重要的研究任务,在智能客服、个人助手等领域广泛应用,具有重要的研究意义和应用价值。早期的检索式对话的方法主要是基于规则的方法、基于统计的方法或基于深度学习的方法。但是,这些方法主要集中于提取对话历史和候选答案之间的信息,解决单轮或简单的多轮对话。当面对更加贴近真实对话和更加复杂的对话场景时,例如多轮对话中多个参与者和多个主题对话纠缠在一起等情况,这些方法并不能利用多轮对话的特点,不能根据不同的主题对话提取有效的特征,对其中对话历史的语义信息提取不足,准确率较低。为了解决以上问题,本文提出了基于语义增强的多轮检索式对话方法,主要的研究内容和创新点如下:(1)提出了基于会话匹配网络的检索式对话方法。受对话解耦思想的启发,通过会话匹配网络对句子中的话题信息进行建模,提取对话级别的知识融入到候选答案的筛选过程中。(2)提出了增强上下文语义的检索式对话方法。通过从多个角度提取对话中的指示信息,包括硬指示信息(Hard Indicative Utterance,HIU)、软指示信息(Soft Indicative Utterance,SIU)和对话解耦策略(Context Disentanglement),将这些指示信息融入语义向量中,增强对话系统的语义信息。综上所述,本文面对多轮检索式对话系统中语义信息提取不足的缺陷,提出了融合会话匹配网络和对上下文指示信息进行建模的方法来增强检索式对话系统的语义信息,一方面,通过会话匹配网络对对话历史中的话题信息进行建模,增强同一话题句子之间的语义信息传递,减少冗余信息,间接地缩短对话历史;另一方面,提取句子中的指示信息,融入到句子向量中,增强对话系统的语义信息。实验表明,会话匹配网络能够提取句子中的话题信息,对上下文知识信息进行建模能够增强语义信息,综合提升了对话系统的准确度。
其他文献
本文主要讨论南亚语系孟高棉语族佤德昂语支佤语布饶方言四音格词的语音、语法及语义的特点,并尝试揭示佤语布饶方言四音格词具有能产性的原因及其蕴含的文化价值。全文一共包括绪论、四个章节和结语。绪论主要介绍本文的研究缘起、对象及意义,研究方法,四音格词相关研究综述和语料来源。第一章佤语布饶方言四音格词的界定结合佤语的次要音节,本章介绍佤语布饶方言四音格词的界定,指出在搜集佤语布饶方言四音格词时,如果遇到有
学位
学位
《魔幻玩具铺》是英国作家安吉拉·卡特所著的关于女性成长的长篇暗黑童话小说。学界对其已有多角度的研究成果,其中现实主义研究将其归为“魔幻现实主义”小说,而卡特却否认并定义为与现实息息相关的自问。目前对卡特现实自问的研究较为缺乏,但现实自问从发问客体、释问方式及讨论反思上具有重要的研究价值。《魔幻玩具铺》中的现实自问与当下社会效率秩序下人的异化具有一致性,体现着卡特后现代主义的社会批判思想。本论文旨在
学位
元话语名词是指标记篇章结构并协助读者理解语篇的名词资源。近年来,随着学术语篇人际互动研究的发展,元话语名词研究才开始受到关注。但目前关于元话语名词的研究主要还是集中在科研论文上,且就研究对象而言,鲜有研究关注中国英语专业学生。由此,本研究旨在比较中国英语专业学生和英语本族语学生议论文写作中元话语名词的使用情况。具体而言,本研究主要解决以下三大问题:(1)中国英语专业学生和英语本族语学生议论文中元话
第二次世界大战结束后,世界秩序发生了重大变化,形成了以美国和苏联为首相互对立的两大政治格局。随着新中国的成立和朝鲜战争的爆发,美国在“多米诺骨牌理论”的指导下加紧对越干涉,希望将越南打造成自由世界在东南亚的基石。1954年,日内瓦协议规定以北纬17度线为界划定临时军事分界线,越南南北分裂。南部由于受到以吴庭艳为首的南方反动势力的破坏最终落入美国手中。在美国势力大举进入越南的这二十年,通过多重手段加
学位
《浮云》是昭和时代的女性作家林芙美子后期的代表作,出版70余年来受到广泛评价。这部作品主要描写了在日本占领的法属印度支那男女主人公的恋爱以及战后两人的漂泊,以“在空间里漂泊的人的命运”为主题,展现了漂泊流浪的雪子的一生。迄今有关女主角雪子的研究,主要集中在对雪子的“沦落”、“娼妓性”以及“放浪”等表现消极沉沦之角度,而对于雪子体现的不懈努力与向往生活积极的一面却缺少关注。笔者认为,对于雪子积极努力
学位
利用语料库对文本的分析主要集中在词汇和句法等层面,而标点符号特征却鲜被探讨。本研究以标点符号为研究对象,以其在翻译汉语中的分布和使用频率特征为焦点,从“翻译汉语中标点符号特征受到英文源语的影响,与其在原创汉语中产生较大偏差”这一假设出发,探究了翻译汉语与原创汉语在标点符号特征上的差异,以及标点符号在翻译过程中从源语到目的语的变化特征。研究主体分为可比语料库和平行语料库分析两部分。可比语料库部分先对
学位
许孚远(1535-1604),字孟中,号敬庵,浙江德清人,师从同郡唐枢。他身处阶级矛盾和民族矛盾尖锐以及社会、政治危机四伏的明朝中后期,这个时期朱学衰颓阳明心学兴盛,逐渐流行起阳明后学末流以“无善无恶”为宗的“空寂寡实之学”。为挽救社会危机,反虚务实,许孚远以孔子为宗,把复性当作学问归宿,试图复兴实用儒学。但对其思想所蕴涵的实学色彩,目前学界并未进行过多的叙述。故本文正文主要从以下五章进行深入地研究和分析。其中第二章乃研究的创新点亦是难点;第三章、第四章乃研究的重点。具体
学位
背景:中耳炎是一种累及中耳(包括鼓室、咽鼓管、鼓窦等部位)的炎性病变,根据病理情况可分为化脓性中耳炎和非化脓性中耳炎两类,其发病与年龄、性别、免疫力、环境等因素有关。慢性中耳炎多因急性化脓性中耳炎治疗不当或不及时所致,患者常有耳鸣、头痛、患耳流脓等症状,严重时可致耳聋,影响患者生活质量和身心健康。耳鸣是在无外界声响刺激时出现的一种异常听觉认知,长期持续性耳鸣不仅影响生活质量,还会引发焦虑、抑郁、烦
丙烯作为最重要的烯烃之一,在国防、农业、交通及日常生活中有着广泛的应用。丙烯的产能目前主要依靠于催化裂化及蒸汽裂解等工艺,得到轻烃的混合物。因而,开发高效绿色的丙