论文部分内容阅读
该文提出了一种针对中文专利文本的聚类方法.使用自组织特征映射算法获得初始的聚类中心,并以此作为K-means算法的初始输入,从而得到最终的聚类结果.这样的组合可以在提高聚类准确率的同时,降低运行时间.在聚类之前还对文本进行LSI降维操作,降低了特征向量的维数,使得SOM和K-means两个对维数敏感的算法可以更加有效和快捷.