基于聚类混合采样的不平衡数据分类

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:sfyaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡分类问题广泛地应用于现实生活中,针对大多数重采样算法侧重于类间平衡,较少关注类内数据分布不平衡问题,提出一种基于聚类的混合采样算法。首先对原始数据集聚类,然后对每一簇样本计算不平衡比,根据不平衡比的大小对该簇样本做出相应处理,最后将平衡后的数据集放入GBDT分类器进行训练。实验表明该算法与几种传统算法相比F1-value和AUC更高,分类效果更好。
其他文献
通过熔融混和法制了10%(重量百分比)无机纳米粒子填充的聚丙烯。填充物是锰氧化物(MnO和Mn2O3)和草酸锰(Mnc2O4)。用透射电镜(TEM)和热重分析法(TGA)研究了这些纳米粒子的形貌和耐热性
《钢筋混凝土结构设计》作为土木工程专业的主干专业课,具有较强的理论性和实践性。针对教师教学和学生学习过程中存在的问题,提出通过教学方法、手段,教学内容选择和增加实
根据财政部门报送国有资产数据信息的要求,资产管理部门要对国有资产数据信息进行汇总、比对、分析后上报,文章指出了在此过程中国有资产数据信息误差形成的原因,提出了消除
以轮椅使用者为例,对轮椅使用者在北京南站的行为过程进行深入的实验研究,运用行为心理学相关理论与研究方法,探讨轮椅使用者行为与环境的互动关系,指出铁路客站无障碍设计的
目的研究康复治疗原发性高血压患者中的中等强度有氧运动的应用效果。方法选取本院接受治疗原发性高血压患者136例作为研究对象,应用数字随机法进行分组,对照组接受药物治疗,
建筑业作为能耗较大的产业,需要实施绿色施工实现节能减排的目标。以住宅楼项目为例,通过施工组织管理、施工工艺技术、绿色施工创新等多措并举,从节能、节水、节地及以治理扬尘
事物的变化往往是从量变开始,量变的不断积累会造成质变。对于采油生产来讲,受自然条件的影响,采油一线设备管理中存在的隐患更多,管理难度更大,更容易发生事故。因此,加强采油一线
医学生承担着救死扶伤的重任,医学创新人才的培养是当前医学高等教育的主要任务。该文就此问题,结合我国的医学教学改革,从分析当前面临的问题八手,对医学创新人才培养提出自己的
“九小场所”火灾多发,究其原因,主要表现在:一是场所内违章乱拉电线,使用电热炉、电加热器、电热毯等电热器具,电气线路缺乏金属管、阻燃塑料管保护,且布置凌乱,裸露在外,空中交横的
水害是影响矿井安全生产的主要因素,以区域水文地质概况为基础,分析了矿井开采后水文地质特征,主要是地形地貌、水文,含水层、隔水层,地下水补给径流排泄及涌水量的变化,对矿