一种改进的不平衡数据流集成分类算法

来源 :阜阳师范学院学报:自然科学版 | 被引量 : 0次 | 上传用户:peteryang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种针对类分布不平衡数据流的分类算法。首先,针对数据流的类分布不平衡,采用改进的重采样方法,建立平衡的训练子集;然后,采用支持向量机在平衡的训练子集上建立基分类器;最后,采用WE集成模型组合基分类器,构建不平衡数据流的集成分类器。该算法通过设定相邻数据块的F-value的差值大于等于某一阈值作为更新分类器的标准,同时在更新分类器时引入错分正类实例重新训练基分类器。实验结果表明该算法不仅对正类有较好的分类性能,对整体也有较好的分类性能。
其他文献
文章以整矩阵为研究对象,利用保持整矩阵整元素特性的整初等变换,研究了将非零整矩阵分解为列满秩整矩阵和行满秩整矩阵的乘积问题,完成了整矩阵的满秩分解。
本文以一种新型保暖内衣材料--弹性复合材料为对象,重点讨论了保暖内衣材料的保暖机理,以及保暖内衣材料保暖性的性能特点,通过对比实验得出一些结论,这对新型保暖内衣材料开
棉是世界上使用最广泛的纺织纤维,90年代的年平均消耗量在19~20百万吨,1997~1998年世界上的棉产量为19.6百万吨,消耗量为19.3百万吨,比上年分别增长1.5%和1.1%.棉通常制成纯棉
无碱玻璃纤维在喷气织机上织造的工艺研究是国内电子级玻 璃纤维布生产厂家非常关注的核心技术问题之一,喷气织机在引纬过程中张力峰值与玻纤纱 品质的关系,在什么条件下,能够使
利用变频调速提高喷气织机及配件的寿命、减少疵布.
学习是求学者与知识的互动过程,互动的优劣决定着学习效果的好坏。作为中介的教学体系,在互动过程中作用显著,而其最关键的问题是"合适度"的匹配。同样一门"西方经济学"课程,适合