基于基尼的模糊kNN分类器

来源 :广西师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:slayerwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,大量的文档涌现在网上,自动文本分类成为处理海量数据的关键技术。在众多的文本分类算法中,kNN算法被证明是最好的文本分类算法之一。对于大多数文本分类来说,文本预处理是文本分类的瓶颈,文本预处理的好坏直接影响着分类的性能。在此介绍了一种新的文本预处理算法——基于基尼的文本预处理算法。同时采用模糊集理论改进kNN的决策规则。这两者的结合使得模糊kNN比传统的kNN表现出更好的分类性能。实验结果证明这种改进是有效的,可行的。
其他文献
将角动量投影壳横型应用到^84Rb核,对组态为πg9/2×υg9/2的正宇称晕带和组态为π(p3/2,f5/2)×υg9/2的负宇称晕带理论计算和实验结果进行了比较,从中确定了此两带的原子核形状。
提出一种将形状上下文特征应用于植物叶片图像自动识别的方法。该方法首先根据叶片形状自适应确定边界点数目,然后计算叶片的形状直方图,最后利用形状直方图计算不同目标之间的匹配相似度。实验结果验证了该方法的有效性。
针对目前设备采购决策中存在的问题,提出一种单层次灰色决策数学模型,并以实例说明其应用。
考虑到网格环境下传统元数据管理系统的不足和元数据本身的特点,根据局部性原理和本体论提出一种高效实用的基于虚拟组织(virtual organization i.e.VO)完全分布的元数据系统模型,
目的 分析以胃肠道多发性淋巴瘤性息肉病为表现的套细胞淋巴瘤(MCL)1例,探讨减少误诊的措施.方法 结合对1例以胃肠道多发性淋巴瘤性息肉病为表现的MCL病例的临床资料与相关文献
现有的计算机网络计费一般采用单一价格或者按时间计费的方式,但它们都无法有效地调节用户对于计算机网络的使用行为.按用量计费是一种新的计费方式,它是根据用户对网络资源
论述随着计算机和网络通信技术的发展,计算机数字化技术、现代通信技术已融合到信息家电中,使之智能化并具有网络信息终端的功能.对蓝齿(Bluetooth)的技术参数及其性能特点进行
目的 观察防滑动空心螺钉内固定治疗髌骨骨折的疗效.方法 采用防滑动空心螺钉内固定治疗髌骨骨折患者16例.结果 本组手术均获成功,手术切口均一期愈合,无感染等并发症.随访3~4