论文部分内容阅读
讨论了两种常用的文本分类算法:Rocchio方法和K近邻方法。前者速度快,但是分类精度通常不能令人满意。后者则相反,他在分类时要花费更多的时间,但分类效果要好很多。通过综合他们的优点并结合专利文本的特点提出了一种适用于专利文本自动分类的层次分类方法。实验表明,该算法具有较好的分类精度与效率。