论文部分内容阅读
本文介绍了一种新的多文档自动文摘方法。该方法的基本思想是通过估计词在文摘中出现的概率来选择最能反映多文档集信息内容的核心词,然后根据该概率计算核心词的权值,最后将整个文档集合中的句子及其信息内容重叠关系表示为一个无向有权图,从中连选出文摘句。本文利用DUC2003和DUC2004的数据集对该方法进行评测。测试表明,该方法所产生的文摘质量优于其它的一些方法比如LexRank.