论文部分内容阅读
本文主要针对对联的个性化生成进行研究。在对联生成研究部分,分析了词库建设,包括词表抽取、词性标注等,研究了用二元词图扩展技术对嵌定字进行扩展生成嵌名联句,并结合基于统计的语言模型、语法模型以及互信息模型进行联句的评价和优选,探讨了基于HMM模型具有特殊嵌定字约束的Viterbi下联解码方法。本文创造性地引入主题模型进行主题对联的生成研究。结果发现,我们的系统能够实现嵌名对联和主题对联的自动生成。 本文的主要贡献是:1)突破了前人的给定上联应对下联的研究模式,提出借助算法及主题和给定的嵌定字使计算机自动生成上联,然后根据约束解码下联的模式。2)在基于统计的语言模型基础上,建立二元词有向图对词进行左右扩展,从而实现嵌名联句生成,之后结合对数线性模型,并用改进的Viterbi下联解码算法,实现了嵌名对联个性化定制功能。3)把PLSA主题模型引入主题对联中上联的计算机辅助生成,用以建立主题候选词集,并且作为生成联句的主题相关度评价函数,然后应用基于HMM的下联解码方法生成与之匹配的下联,从而完成主题对联的定制。4)应用隐马尔科夫链族进行词性标注,提高了模型的准确度。实验结果证明本文的方法行之有效,能够实现个性化对联的定制功能。