论文部分内容阅读
文本分类通常采用统计方法选取特征,在不同领域之间进行文本分类时,通常不考虑领域内部所具有的特有的知识关系。本文提出了一种基于领域知识关系的领域文本分类模型,该模型采用支持向量机学习算法,结合样本统计与领域术语构造领域分类特征空间,利用领域内部知识关系,计算领域概念间的相关性,从而为分类特征赋予一定权重,实现领域文本分类。并利用该模型进行了云南旅游领域与非旅游领域文本分类实验,结果表明,领域知识关系对领域文本分类有较大影响,分类的准确率比改进TFIDF方法提高4个百分点。