【摘 要】
:
针对网络行为数据不均衡的问题,从数据均衡化和集成学习两个角度出发,提出一种基于动态抽样概率的集成学习算法。依据抽样概分布对多数类样本进行重采样,相比随机抽样,能更准
【基金项目】
:
陕西省自然科学基础研究计划项目(2015JM6347);陕西省教育厅科技计划项目(15JK1218);商洛学院科学与技术项目(17sky003)
论文部分内容阅读
针对网络行为数据不均衡的问题,从数据均衡化和集成学习两个角度出发,提出一种基于动态抽样概率的集成学习算法。依据抽样概分布对多数类样本进行重采样,相比随机抽样,能更准确地加大对错分样本的学习。在更新样本抽样概率时,依据本轮迭代之前所得分类器的集成测试分类效果,而不是只依据本轮迭代所得分类器的分类效果。用7组UCI数据集和KDDCUP数据集来评估算法在不均衡数据集下的分类性能,实验结果显示,算法在不均衡数据集上的分类性能都有相应的提高。
其他文献
了解抗茵药物说明书中儿童用药项标注情况。方法:对桌儿童医院正在使用的抗菌药物说明书中儿童用药项按抗菌药物种类、剂型、生产厂家和基本药物进行统计分析。结果:抗菌药物说
为了满足人们对保暖材料日益提高的要求,本文在羽绒原有性能的基础上研发了长丝与熔喷双组分复合伴生仿鹅绒纤维材料。与熔喷材料的复合有益于提升仿鹅绒材料的保暖效果且手感
虚拟仿真实验教学是我国高等教育方式改革的方向之一,已在很多专业的实验教学中取得了一定的成果。在新工科教育背景下,借助虚拟仿真实验教学助力食品微生物实验教学的改革,
急性阑尾炎是临床最常见的一种急腹症,目前治疗仍以手术为首选方法,临床为积极预防术后并发症、促进胃肠功能恢复,多采用内外结合、中西贯通的方式。笔者查阅文献资料,综述了
林剑撰文《文化与文明之辨》指出,在历史上与现实生活中,将文化与文明两个概念混用或相等同是一种普遍现象。我们可以从词源学、发生学以及人们在日常生活中的具体语境等不同维
目的探讨流体剪切应力对氧化型低密度脂蛋白(ox-LDL)导致的血管内皮细胞损伤和黏着斑重塑的影响。方法以100μg/mL ox-LDL诱导人脐静脉内皮细胞(HUVECs)损伤模型,构建5、25 dyne/
腰椎间盘突出症是引起腰腿痛的常见原因,常由内在因素和外在因素共同作用引起.传统观点认为,本病主要发生于中老年,但近年我院就诊的青年人有增多趋势.本文通过对我科收治的1
目的:总结早期胃癌(EGC)患者的诊断以及手术治疗要点,为EGC诊治工作的开展提供参考.方法:选择我院2011—2015年期间收拾确诊采取手术治疗的60例E G C患者作为实验对象,患者均经胃
申农的信息论将熵与信息联系起来,那么风险与信息,风险与熵之间是否也存在某种联系。本文将试图去发现和研究风险、信息和熵之间内在联系。在对三者关系进行了初步分析后,认
目的 :通过对武汉市某区 180 0名 3岁以下婴幼儿发样分析 ,探讨该区婴幼儿发中铜、锌、铁、钙、镁含量的正常水平和婴幼儿部分微量元素营养状况。方法 :采集婴幼儿发样进行预