论文部分内容阅读
针对传统的RNN算法存在梯度消失的缺陷,在面对海量新闻数据,规模大且分类属性多的情况下存在效率低的问题,该文应用了传统的RNN模型改进后的LSTM神经网络算法,加入了预训练的word2vec模型。首先对新闻数据进行去除停用词及标点、格式转化、分词等预处理;其次进行特征提取、分类模型构造;最后进行了分类模型训练与测试。测试数据表明,在大数据量的情况下,使用LSTM算法具有较高的模型准确度和良好的扩展性。