论文部分内容阅读
本文首次提出将粗糙集的属性约简与支持向量机结合处理中文网页的分类问题,具有如下独特优势:
支持向量机处理小样本分类时,能得到较好的效果,但应用于中文网页分类时,由于数据量大,其鲁棒性特点得不到发挥。粗集约简能大大降低原属性空间的维数,减少了用于支持向量机分类学习的数据量,可以提高支持向量机的训练速度和测试速度。粗集约简从属性对分类能力贡献大小的角度进行特征的删减,这种属性删除是在保持与原属性集的分类能力相等的原则下进行的,。支持向量机是一种高性能的分类器,可以处理像中文网页分类这种稀疏矩阵中的分类问题,粗集约简与支持向量机结合的分类器处理中文网页分类问题将具有更佳的优势。