论文部分内容阅读
自动摘要是解决网络信息过载问题的关键技术之一。在对文本中句子的特征和句子之间的语义距离分析的基础上,提出了一种基于句子特征和语义距离的自动文本摘要算法。首先计算文档中句子的各个特征权重,在此基础上决定句子的权重;然后,通过句子之间的语义距离计算,修改句子的权重,据此进行排序,权重大的作为文本的主题句;最后,对文摘句进行平滑处理,生成文字流畅的文本摘要。实验表明,该算法在不同的压缩率下生成的摘要接近于人工摘要,具有较好的性能。