论文部分内容阅读
在利用统计方法对文摘中词频特征和词位置分布特征进行分析的基础上,提出增加词同现特征用于自动文摘系统的新方法。文中把该方法表示为基于词位置与同现特征的中文自动文摘模型,模型中利用了文本压缩方法对文摘句进行排重,同时借助文摘句指示词表和非文摘句指示词表对文摘句进行二次筛选,提出了应用加权重合率对自动文摘进行评价并给出了实验结果。实验结果表明,该模型在处理中文学术文献时效果明显:词同现特征与指示词分别提高了实验结果分值的21%和23%。