论文部分内容阅读
利用FOIL(一阶规则学习)算法提取文档对应的一阶规则,并用之于Web中文文档的分类.同时,对FOIL分类器进行改进,如:控制每个类别的规则数量;对规则前提进行剪枝;对无法识别的文档生成缺省规则;充分利用Web文档的半结构性等.仿真实验结果表明,本文所作的改进使分类器的各项性能均得到了很大程度的提高.