论文部分内容阅读
为了提高中文关键词提取的准确率和实用性,提出了一种改进了候选词权重计算的关键词提取算法TFLD(term frequency,location&distance algorithm),利用候选词权重排序自学习,提高了提取关键词算法的效率。该方法采用词语词频统计、分布区域以及词语距离位序3种特征项,并使用最小均平方(LMS)法则训练算法模型的调整因子。实验结果表明,该方法提高了关键词提取的精度。