多轮对话文本连贯性研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:q355868060
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连贯性是衡量语句内部逻辑是否自洽的重要属性,连贯性更高的对话更容易被整合成一个易于理解的整体,因此,对话的文本连贯性评估是对话质量评估的一个关键指标。目前针对文本连贯性建模的研究主要集中在新闻报道等独白式语篇,针对对话的连贯性建模研究较少。因此,本文分别研究基于传统机器学习方法和深度学习方法的对话连贯性建模,并结合对话文本中蕴含的语义信息和对话行为类标表征的意图信息,构建对话连贯性模型。实体网格模型是最受欢迎的连贯性建模方法,其从语言学出发,根据文本中相邻句子间的实体分布模式来建模文本连贯性。因此,本文的第一个研究工作是改进经典的实体网格模型,引入对话特有的意图信息,并采用传统的机器学习方法进行对话连贯性建模。本文首先构建包含对话意图的对话行为实体网格,而后建模对话中实体在话语间的意图转换,并结合有监督的机器学习算法,构建对话连贯性模型。在多轮对话数据集上的实验结果验证了意图信息对对话连贯性建模具有一定的指导作用。上面的基于传统机器学习方法的对话连贯性模型,需要人工抽取特征,系统迁移性和泛化性差,且无法捕获实体的意图信息在话语间的长距离转换。因此,本文的第二个研究工作提出基于深度神经网络的对话实体网格连贯性模型,在对话行为实体网格的基础上,结合卷积神经网络模型,捕获实体在话语间的长距离意图转换,进行对话连贯性建模。实验结果表明了卷积神经网络模型与对话意图相结合的方法对对话连贯性建模的有效性。前面两个基于实体网格的对话连贯性建模方法需要进行实体抽取,但由于对话文本通常较为简短且偏口语化,抽取实体相对困难,而且可能会导致误差传播。因此,本文的第三个研究工作提出对话行为增强的分层对话连贯性模型,通过分层编码器直接对对话文本进行语义建模,并在话语层和对话层两个层面分别融合对话的意图信息,结合对话的语义和意图信息进行对话连贯性建模,在公开的多轮对话数据集上的实验结果验证了该模型的有效性和鲁棒性,相关论文已被2019年IJCNN(CCF-C类)会议录用。本文研究了多轮对话连贯性建模的不同方法,基于对话的不同表现形式(实体网格、文本),采用多种自然语言处理研究方法(传统机器学习方法、深度学习方法),利用对话的多种信息(文本蕴含的语义信息、对话行为类标表征的意图信息)构建对话连贯性模型。实验结果验证了本文提出的对话连贯性模型的有效性和鲁棒性。
其他文献
免职是我国公务员制度中重要的用人手段,本身不带有惩戒性和贬义色彩。但随着行政问责制度的兴起,免职在我国立法和实践中逐渐成为一种问责的形式。由于缺乏程序和免职后重新
资产追回与返还机制是《联合国反腐败公约》最重要的机制之一。但在我国现行法律下顺利追回外逃腐败资产还存在诸多障碍。在其中引入公益诉讼有着现实性和可行性,但需要完善我
文章从国内外体育旅游的现状出发,运用SWOT分析方法,客观地对杭州市体育旅游的内部优势和劣势、外部环境带来的机遇和挑战进行了分析,在此基础上提出发展杭州市体育旅游的战
近几年,我国老牌积木品牌、深耕小颗粒积木领域的启蒙发展速度很快。在塑胶积木市场竞争日益激烈的情况下,启蒙积木的年销售量却一直保持上升趋势。2017年3月~11月,启蒙的销
目的:探讨针灸预处理诱导热休克蛋白(HSP)表达对心肌缺血再灌注损伤(MIRI)兔延迟保护作用的机制。方法:新西兰大耳白兔随机分为假手术组、模型组、电针组和艾灸组,每组18只,
潍坊市发展淘宝村是适应电子商务快速发展的客观需要;是建设农产品电子商务之都的现实需要;发展淘宝村有助于增加农民收入。要发展淘宝村需要积极对接阿里巴巴,争取各类试点
生态文明是全面建设小康社会,实现中国经济可持续发展的基础和保障,建设生态校园,提高大学生的生态文明素养,是时代赋予高校的新使命。本文结合当前高校生态文明教育的现状,
眼眶位于头颅前部、正中线两侧,介于颅骨和面颅之间。眼眶骨折(fractures of the orbit)常见于交通事故、拳击、棍棒打击等,根据骨折的部位不同分为眶内壁骨折、眶外壁骨折、
旨在从脑膜炎症状仔猪的脑组织及其他脏器中分离鉴定病原菌。采集患病仔猪脏器分离病原,通过PCR及血清凝集试验鉴定其种属及血清型;透射电镜观察分离株的超微结构;经多序列位
废用状态下肌肉组织最明显的变化是肌肉萎缩,它不仅使肌肉形态、结构方面有所变化。其生化代谢与功能活动也可发生明显改变,其机理尚不清楚。因此,探索废用性肌肉萎缩的发生机理