【摘 要】
:
在文本分类过程中,类别之间的重叠以及标志类别属性的不足会导致类别的边界之间出现模糊不确定性和粗糙不确定性,而传统的k-近邻方法无法解决这一问题;同时,在传统的k-近邻方
【机 构】
:
江西师范大学计算机信息工程学院(江西南昌)
【出 处】
:
第二届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2004)
论文部分内容阅读
在文本分类过程中,类别之间的重叠以及标志类别属性的不足会导致类别的边界之间出现模糊不确定性和粗糙不确定性,而传统的k-近邻方法无法解决这一问题;同时,在传统的k-近邻方法以及其他一些改进的k-近邻方法中,最优k值的选取需要通过训练得到.文中借助模糊-粗糙集理论来改进传统的k-近邻方法,并使用基于距离的邻域空间,以不经训练地确定适宜每个待分类文本的k值,最后将所提方法和其他一些k-近邻方法进行了实验比较,结果表明模糊-粗糙集方法能够在一定程度上提高分类的精度和召回率.
其他文献
遗传算法对许多问题是有效的,但普通遗传算法只能保证全局最优解的出现而不能保证每次都收敛于全局最优解,其原因是在搜索过程中出现的全局最优解不能保留下来.针对这一问题,
注射成型制品出现的缺陷,例如填充不满、焦烧、气痕和银纹等,主要是由于模具的排气不良引起的,本文中对充模过程中模腔内宾气的状态变化情况进行了计算,通过对计算结果的分析,说明
油料勤务网络训练是依托军用网络,利用各类油料勤务信息系统和油料勤务信息资源,组织训练和教学的实践活动。本文分析了开展军队院校油料勤务网络训练的必要性和基本构想,提出了
8月14日,国务院办公厅发布《国务院关于促进信息消费扩大内需的若干意见》。在梁春晓看来,该文件明确了面向未来的中国经济,信息消费和电子商务已经成为中国经济增长和转型的最
今年的6月5日是第42个世界环境日,联合国确定的主题是:“思前、食后、厉行节约”。我国确定的环境日主题是:“同呼吸,共奋斗”,而第18届“津沽环保行”就在环境日来临前夕启动。在