论文部分内容阅读
针对海量学科试题所引发的试题管理混乱现象,提出一种基于SVM的学科试题自动分类法。对学科语料进行分词、去停用词和统一相似词等预处理操作;采用TextRank算法对学科语料进行权重赋值,将语料文本向量化;用SVM中的Linear核函数训练语料得到分类器。用语料库中的12类单选题进行测试,整体分类的准确率、召回率、F1值均达到97%以上。结果表明,该分类法可以有效地分类试题文本。