论文部分内容阅读
针对文档分类过程中不同大小文档表示、文档特征选择和文档特征编码问题,提出了一种基于粗糙集的角分类神经网络Rough—CC4.利用近义词构成等价类,以此表示文档,可以缩小文档表示的维数、解决由于文档不同大小导致的精度问题、模糊近义词之间的差别;利用二进制编码方法对文档特征编码,可以提高Rough—CC4的精度,同时减小Rough—CC4的空间复杂度.Rough-CC4可以广泛用于大量文档集合的自动分类.