基于大规模候选集的检索型多轮对话模型

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:suli115296303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的深刻变革,新一代端到端聊天式对话系统已广泛用于娱乐聊天机器人、个人助手和公司智能客服等实际场景中,成为人工智能领域最具有应用前景的技术之一。与传统的人机交互方式不同,智能对话系统不仅能够理解人类日常交流的语言并作出有意义的回答,还能够通过一系列的对话完成某一项任务。通常地说,端到端聊天式对话系统技术主要分为检索式对话系统和生成式对话系统两大类。生成式对话系统根据已经进行的对话历史利用自然语言生成技术重新生成回复。尽管生成式系统有希望能够不局限于预先建立回复的范围,但是生成式系统也会遭受目前自然语言生成技术所带来的流畅性不足、倾向于回复通用性语句等问题。相比于之下,检索式对话系统主要利用信息检索技术对一组预先建立的候选回复进行打分和返回最合适的回复,在大多数情况中能够提供更加流畅并有意义的回复。然而,预建立的候选语料质量不高会影响检索式对话系统的回复合理性,预建立候选回复的数目种类不足也会显著地降低检索式对话系统的回复多样性。针对上述问题,本文主要以较大规模候选集场景下的检索式多轮对话模型为研究课题,首先提出时空特征匹配网络,研究其在大量候选回复场景下的性能和效率,同时分析时空匹配特征的可解释性和模型的优缺点。通过对比实验和可视化分析,本文证明了基于时空匹配特征的检索式多轮对话模型能在较大规模候选集场景下以更低的时间复杂度达到更好的性能。同时,本文重点关注端到端的检索式对话模型的的语义理解能力,将预训练语言模型引入聊天型对话系统中。本文接着提出交谈者分割机制和多轮对话增强方法提高预训练对话检索模型的性能。通过在多轮对话输入中分割交谈者,引入与讲话人相关的输入特征,并采用特定的数据增强方法生成更多的训练数据,使得预训练对话检索模型能够更好地对多轮对话的连贯性和逻辑性进行建模。对比实验结果显示本文提出的方法超过了大量基线模型,同时实验结果显示在较大规模候选集中也能获得更好的性能提升。
其他文献
设In是有限集Xn={1,2,…,n}上的对称逆半群,并设IOn,DPn和ODPn分别是有限集Xn上的保序变换半群,等距变换半群和保序等距变换半群.1992年,Gomes和Howie研究了有限保序变换半群
菜心(Brassica campestris L.ssp.chinensis(L.)Makino var.utilis Tsen et Lee)是华南地区特产蔬菜,它风味独特、口感极佳、适应性广、可全年种植生产供应。由于设施大棚内
"把关人"是社会心理学家库尔特·卢因于1947年提出的概念,卢因认为,在传播过程中,信息由信源到受众并不是直接传递的,其中要经过若干决定信息通过或不通过的人或者机构,这些
会议
数学应用题的自动解答是一个综合性很强的研究课题:其中涉及了文本预处理、自然语言理解、知识提取与表示、自动求解等若干关键技术。本文提出基于过程性知识进行应用题的自
在敌意收购与反收购的过程中,目标公司的小股东在资金、专业、经验等方面,处于弱势的地位,容易遭到敌意收购方及目标公司大股东或董事的利益掠夺,因此对于小股东的保护特别重要。本文依据我国近几年来资本市场发生的敌意收购与反收购事件,分析其对目标公司小股东产生的影响,思考如何维护目标公司小股东的权益。本文主要论述了在敌意收购与反收购过程中,收购方的敌意收购行为与目标公司的反收购行为容易对目标公司小股东的权益
等离子体作为一种由大量非束缚态的带电粒子构成的特殊材料,其电磁性质在很宽的频带内表现出与普通电介质不同的特性。实验室中,通过调节放电功率和气体压强等参数,可以定量
甲型流感病毒(Influenza A Virus,IAV)是一种严重危害到人类和易感动物健康和安全的正粘科病毒。天然免疫系统是机体防御病原微生物入侵的第一道防线,其生物效应依赖于复杂的信号传导和动态的基因表达调控。长链非编码RNA(long non-coding RNA,lncRNA)是一类不编码蛋白质的RNA转录本。病毒可以利用宿主的lncRNA来调控细胞基因的表达模式,进而改变细胞内的微环境,
农民专业合作社是建立在家庭联产责任承包制的基础之上,同类农产品的生产经营者或者同类农业生产经营服务的提供者、利用者,自愿联合、民主管理的互助性经济组织。中国目前的农民专业合作社仍处在起步阶段,许多治理问题随着合作社的发展逐渐显现。2007年7月《中华人民共和国农民专业合作社法》颁布以来,一系列配套的法律法规和相关扶持政策的出台也在逐渐改善合作社发展的外部条件,因此,完善农民专业合作社内部的治理机制
作为一个经典的组合优化问题,同时也是一个NP-hard问题,国内外对于三维装箱算法的研究已经持续了多年并且取得了很好的效果。为了求解这个难题,我们提出了一个带八条装载参考线的分层搜索算法,在选择块(箱子)与剩余空间时,增加了块高与剩余空间装载参考线的匹配度这一衡量标准。实验结果表明,即使在空间装载率已经达到很高水平的情况下,与目前最优算法相比,该算法在小部分数据集上还是有所突破。作为另一个NP-h
认缴制的确立,赋予股东出资自由,同时却造成债权人利益面临冲突。其中,包括股东认缴出资未到期与债权人到期债权的冲突、认缴随意性与实缴能力冲突、认缴出资隐蔽性与资信公开需求的冲突。为保护债权人利益,在公司存续状态下,出资未届期的股东是否负有出资加速到期责任,理论界与实务界存在争议。“否定说”不符合公司法的利益平衡价值,“折中说”不具备现实操作性。“肯定说”主张,在公司正常经营状态下股东出资加速到期的观