论文部分内容阅读
基于支持向量机学习模型,使用万方期刊数据库中医学、卫生的有关标题和摘要数据,本文对医学、卫生大类下的R7中的九个小类进行了自动分类研究。在中文信息处理知识和技术的基础上选取分类特征,本文在分类过程中主要采取了基于低密度多特征的训练方法。在互信息、卡方统计、交叉熵和证据权值四个不同的统计特征量的开放测试中,自动分类的查全率和准确率都取得了相对令人满意的结果。