论文部分内容阅读
连贯性是衡量语句内部逻辑是否自洽的重要属性,连贯性更高的对话更容易被整合成一个易于理解的整体,因此,对话的文本连贯性评估是对话质量评估的一个关键指标。目前针对文本连贯性建模的研究主要集中在新闻报道等独白式语篇,针对对话的连贯性建模研究较少。因此,本文分别研究基于传统机器学习方法和深度学习方法的对话连贯性建模,并结合对话文本中蕴含的语义信息和对话行为类标表征的意图信息,构建对话连贯性模型。实体网格模型是最受欢迎的连贯性建模方法,其从语言学出发,根据文本中相邻句子间的实体分布模式来建模文本连贯性。因此,本文的第一个研究工作是改进经典的实体网格模型,引入对话特有的意图信息,并采用传统的机器学习方法进行对话连贯性建模。本文首先构建包含对话意图的对话行为实体网格,而后建模对话中实体在话语间的意图转换,并结合有监督的机器学习算法,构建对话连贯性模型。在多轮对话数据集上的实验结果验证了意图信息对对话连贯性建模具有一定的指导作用。上面的基于传统机器学习方法的对话连贯性模型,需要人工抽取特征,系统迁移性和泛化性差,且无法捕获实体的意图信息在话语间的长距离转换。因此,本文的第二个研究工作提出基于深度神经网络的对话实体网格连贯性模型,在对话行为实体网格的基础上,结合卷积神经网络模型,捕获实体在话语间的长距离意图转换,进行对话连贯性建模。实验结果表明了卷积神经网络模型与对话意图相结合的方法对对话连贯性建模的有效性。前面两个基于实体网格的对话连贯性建模方法需要进行实体抽取,但由于对话文本通常较为简短且偏口语化,抽取实体相对困难,而且可能会导致误差传播。因此,本文的第三个研究工作提出对话行为增强的分层对话连贯性模型,通过分层编码器直接对对话文本进行语义建模,并在话语层和对话层两个层面分别融合对话的意图信息,结合对话的语义和意图信息进行对话连贯性建模,在公开的多轮对话数据集上的实验结果验证了该模型的有效性和鲁棒性,相关论文已被2019年IJCNN(CCF-C类)会议录用。本文研究了多轮对话连贯性建模的不同方法,基于对话的不同表现形式(实体网格、文本),采用多种自然语言处理研究方法(传统机器学习方法、深度学习方法),利用对话的多种信息(文本蕴含的语义信息、对话行为类标表征的意图信息)构建对话连贯性模型。实验结果验证了本文提出的对话连贯性模型的有效性和鲁棒性。