论文部分内容阅读
关于热词的分析提取,主要根据特征词的权重评估一字词对于一个文件集或一个语料 库中的重要程度.在信息技术中,传统的TF-IDF函数得到广泛运用.在文中分类中,有学者提 出TF-IGM 函数,即量化词项使用词频和文档重力力矩来判断一个特征是否有区分度,文中针对 TF-IGM 函数进行改进研究.