论文部分内容阅读
PU文本分类(以正例和未标识实例集训练分类器的分类方法)关键在于从 U(未标识实例)集中提取尽可能多的可靠反例,然后在正例与可靠反例的基础上使用机器学习的方法构造有效分类器,而已有的方法可靠反例的数量少或不可靠,同样构造的分类器也精度不高,基于 SVM主动学习技术的 PU 文本分类算法提出一种利用 SVM与改进的 Rocchio分类器进行主动学习的PU文本分类方法,并通过 spy技术来提高 SVM分类器的准确度,解决某些机器学习中训练样本获取代价过大,尤其是反例样本较难获取的实际问题。实验表明,该方法比目