论文部分内容阅读
文本匹配问题在自然语言处理领域中占据着核心的地位,匹配检索信息、智能问答、机器翻译、对话系统、释义识别等都可以归纳为文本匹配问题,其本质都是匹配文本之间的相似程度。传统文本匹配模型具有结构简单、运算速度快等特点,但是传统文本匹配模型需要依靠大量的人工处理,花费极大的人力物力代价才能获取到极少有用的信息,在实际工程应用中仍存在语义匹配误差较大、匹配精度不高的问题。本文针对深度文本匹配模型进行研究与分析,提出基于残差网络策略的匹配金字塔模型和多粒度捕获匹配特征模型,达到提升文本匹配准确率的目的,最终将研究成果应用于在线考试平台的智能评阅功能。本文的主要工作有以下几点:1.引入残差网络策略改进匹配金字塔模型。匹配金字塔模型的搭建难以确定其最优的网络层次结构,浅层的网络结构无法使数据得到充分的训练无法达到最优,深层的网络结构使模型训练速度慢且容易引发网络退化问题。本文提出一种基于残差网络策略的匹配金字塔模型,引入残差网络思想使模型能自我判断其最优层,并对冗余层进行恒等映射,保障模型能进行深层次的训练,避免发生网络退化问题,从而提高文本匹配的精确度。通过实验对模型匹配效果进行比较,实验结果表明改进后的匹配金字塔模型匹配效果在训练数据集上有明显的提升。2.提出多粒度捕获匹配特征模型。为改善匹配金字塔模型考虑粒度单一、缺失高层次粒度交互信息的问题,设计了多粒度捕获匹配特征模型。根据人理解句子的思维方式,对这一思考过程进行建模,构建了文本的多粒度表达,将匹配的过程划分为多个粒度,不再局限于单一粒度的思考,完善了文本所包含的语义信息。从各个粒度中捕获文本之间的交互信息并结合捕获到的匹配特征给出文本之间的匹配程度。实验结果表明,多粒度捕获匹配特征模型的匹配效果好于标准的匹配金字塔模型,在匹配性能指标上有明显的提升。3.利用多粒度捕获匹配特征模型解决在线考试平台的主观题智能评阅问题。将本文提出的多粒度捕获匹配特征模型应用到考试系统中的评阅模块之中,用于解决主观题的智能评阅问题,为评阅教师提供评分参考。实验结果表明,多粒度捕获匹配特征模型评阅效果优于传统评阅模型。