论文部分内容阅读
随着自然语言处理技术的不断发展,文本处理技术进一步引起人们的关注,如信息检索、文本分类、文本自动生成等等。这些技术会使我们的工作变得更为简单、快捷。但是在实际应用中这些技术在处理结果上还存在一定程度的不可靠性。比如在文本自动生成时,由于算法的限制导致生成的文本在某些段落不连贯。但是由于生成文本的篇幅太大,无法快速地进行人工识别。如果存在一种技术使文本生成之后自动地对文本进行连贯性检测,那么我们就可以使生成的文本更加通顺而且更具有实用性。除此之外,在与自然语言处理领域相关的深度处理过程中,由于在预处理阶段没有保证语料的连贯性而造成实验结果不准确的情况也是经常发生。针对以上两个问题,本文提出了汉语篇章连贯性分析这一课题。该课题的研究是基于保证篇章连贯性的四个必要条件:句与句之间至少要有概念上的联系、篇章的句子序列必须符合逻辑、篇章中各句的主位和述位必须相互联系、篇章所涉及的话题必须具有相关性。首先分别围绕其中一个条件去分析汉语篇章的连贯性。最后,将四个解决方案融合起来,从多个方面综合起来进行汉语篇章连贯性自动分析方法研究。在本文中已经从“句与句之间至少要有概念上的联系”和“篇章中各句的主位和述位必须相互联系”这两个方面去做了相应的研究并提出了解决方案。从最终的实验结果上看,本文提出的解决方案在一定程度上能够分析出篇章中句子的连贯性。但要得到更准确的分析结果,必须还得综合四个方面一起去分析。