基于Biased-SVM的非平衡半监督分类算法

来源 :河南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:shenlixi44
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对非平衡数据的半监督分类问题,提出了一种基于Biased-SVM的非平衡半监督分类算法.该方法首先利用初始的标记样本集训练处理不平衡数据的Biased-SVM模型,然后用训练好的Biased-SVM模型为未标记样本加上标签,再把新标记样本加入到初始标记样本集中,重新训练Biased-SVM模型,最后在测试集上进行测试.选取公共数据库里的一些数据集进行实验,首先在两类不平衡数据集上实验的结果表明,在标记样本所占比例为20%~80%时,所提方法能够在不降低数据集整体G-mean值的基础上,提高小类的F-value值并具有较高的稳定性;然后在多类不平衡数据集上实验的结果表明,在标记样本所占比例为20%~80%时,所提方法能够在不降低数据集整体的EG-mean值的基础上,提高小类识别率并具有较高的稳定性. To solve the problem of semi-supervised classification of unbalanced data, a non-equilibrium semi-supervised classification algorithm based on Biased-SVM is proposed in this paper. Firstly, the initial labeled sample set is used to train the Biased-SVM model of imbalanced data, Biased-SVM model is used to label the unlabeled samples, then the new labeled samples are added into the initial labeled sample set to re-train the Biased-SVM model and finally tested on the test set.Experiments are performed on some datasets in the public database . The experimental results on two types of unbalanced datasets first show that when the proportion of labeled samples is 20% ~ 80%, the proposed method can improve the subclassification without reducing the overall G-mean value of the dataset The results of experiment on many kinds of unbalanced datasets show that when the proportion of labeled samples is 20% ~ 80%, the proposed method can be used in the data set without reducing the data set Based on the overall EG-mean value, the recognition rate of small class is improved and has high stability.
其他文献
威廉·布莱克(1757-1827)是英国卓越的诗人和画家,是早期浪漫主义的代表之一,也是英国文学史上伟大的神秘主义诗人。他自幼耽于空想,常常游走于不可思议的幻境。正因为他这不拘
“年老必智衰”被很多人认为理所当然,其实,年老未必智衰,老年人同样大有可为。  科学地认识人的智力发展过程  一般认为,20岁左右是人智力发展的高峰,一直能保持到四五十岁。六十岁开始可能智力有所衰退。到八十岁的时候,可能出现中等程度衰退。因此不能笼统认为,老年人一退休,智力就衰退,就无所作为了。  老年人智力衰退的个体差异很大。有的人六七十岁就糊里糊涂,有人到八十岁,还保持很高的智力水平。很多老科
期刊
中国传统文化中有“五行”之说。古代先民认为,天下万物皆由“木火土金水”五类元素组成,各元素之间存在相生相克的关系,其运动变化称为“五行”。在情绪上,“五行”对应着“五志”,为“怒喜思悲恐”,它们之间也相互制约,称为“五志相胜”,即“恐胜喜,怒胜思,喜胜悲,悲胜怒,思胜恐”。  北京回龙观医院中西医结合科主任闫少校认为,人的七情六欲在适度范围内都是正常的,但当某种情绪过于强烈,心理就会失衡,这时就可
期刊
本论文主要针对文本及其存在的社会历史文化语境的关系展开论述。20世纪80年代,中国历史进入了标志着社会转型的改革开放时期,伴随着市场经济的确立中国社会在诸多方面产生了深
大棗有生津润肺除燥、养血滋肝息风、疗脾胃衰弱的功效,因此被列为药中上品。如能将大枣与大米、小米或糯米同煮为粥,即可有不错的保养效果,民间有“若要皮肤好,粥里加大枣”的说法。在用大枣熬粥时最好将大枣剖成几块,这样有利于熬出枣中有效成分,增加食疗效果。很适合春夏之交时食用。
期刊
宋代的辑佚活动作为中国古籍辑佚史上的重要组成部分,不仅从事辑佚人数多、辑本类型多样,而且辑佚方法逐渐成熟,辑佚记载渐趋明晰。但是由于文献资料散见,加之宋人记载大多语
按照我们的传统习俗,宝宝百天的到来,对于每个家庭来说都是一个具有特殊纪念意义的日子,在这么重要的时刻拍摄一套百天照是很有价值和意义的,这是父母给宝宝人生的第一份礼物
对于生活讲究、崇尚自然的女性来说,用中草药和干花浸液来洗脸,同时配合外敷疗法,不仅可美颜养肤,还天然无害。  清透洗液  操作方法:取金莲花、杭白菊各5朵,用开水浸泡3-5小时,待浸液呈淡黄色时,去渣取液,把干净的面膜无纺布浸入汁液中泡10分钟,取出置干净容器中备用;然后用泡好的浸液洗脸10分钟;最后把浸泡过的面膜无纺布敷在脸上约20分钟。  专家点评:此法可使肌肤滑润、白皙,还有明目的作用。长期
期刊
拉什迪被誉为后殖民主义小说教父,本文意图对拉什迪小说中的后殖民叙述策略进行研究,并探讨其后殖民叙述策略的作用机制。本论文共包括三个主要部分。  第一部分为绪论,首先对
年末,聚集在西子湖畔的十几家都市报老总们热烈探讨着都市报的下一个发展机遇.会上会下,大家普遍认同这样的观点:2006年开始,深化报纸出版体制改革所引发的竞争活力,以及转变