论文部分内容阅读
目前维吾尔语文本分类仍存在特征空间的高维度问题以及文本向量表示的高稀疏性问题,为了更好地解决这一问题.首先根据词性特征过滤掉对文本分类无意义词或者包含少量分类特性的词汇,然后分别在KNN、决策树、SVM、CNN、RNN、CNN-BLSTM等分类器上进行实验.实验结果表明,与传统语料相比,根据词性过滤过的语料对多数分类器实验的准确率均有所提高,并且大大缩短训练时间.