论文部分内容阅读
以儿童保健知识作为文本分类场景,采用深度学习word2vec中的词向量与IF-IDF中的词频重要性相结合构建特征工程,然后选择XGBoost集成学习分类算法构建模型。通过对知识集合进行仿真实验,结果表明:基于词向量特征的文本分类模型较VSM能够有效提高对文本分类的效率,同时也提高了分类准确率。