论文部分内容阅读
传统文本表示模型多为稀疏矩阵,文本规模的增长导致维度灾难。文中提出一种结合神经网络的文本降维方法,利用随机映射、非负矩阵分解、隐含语义分析等方法实现文本降维,使用自建微博文本数据集比较其效率和准确率,并在最优降维方案的基础上使用自组织神经网络算法进行聚类。实验结果表明,该方案准确率相比传统不降维的K-means聚类方法有一定提升。