基于改进Switching集成算法的具有类间重叠不平衡数据分类

来源 :系统工程 | 被引量 : 0次 | 上传用户:hbhhl2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确识别具有类间重叠的不平衡数据类别有着重要的理论意义与应用价值。首先,基于Switching集成学习框架,结合样本类间重叠度和邻域分布信息,定义了样本类别待转换的概率,进而提出了一种针对具有类间重叠不平衡数据分类的集成学习算法,SwitchingHD。该方法在提升少数类样本可见性的同时,完全保留了少数类样本的真实信息,能有效克服已有Switching集成学习算法在具有类间重叠不平衡数据分类中的局限性。其次,在3种评价指标下,对比了SwitchingHD与3类Switching集成算法及2类传统集成学习算法在33个具有类间重叠不平衡数据集上的分类表现。再次,分析了6类集成学习算法分类效果对待转换样本比例和基分类器数目的敏感性,给出了最优待转换样本比例的范围及这两个因素的作用效果,分析表明SwitchingHD在AUC下的分类效果显著优于其它集成学习算法,针对具有类间重叠的不平衡数据分类问题具有有效性与优越性。最后,以某地区电信客户数据为例,进一步对比SwitchingHD与11种新颖集成学习算法识别潜在流失客户的效果。
其他文献
研究目的神经病理性疼痛是由中枢或周围神经损伤引起的一种慢性疼痛,其基础是中枢神经系统的敏化。神经损伤可诱发各种免疫炎症因子释放,激活细胞内信号传导通路导致痛觉过敏。神经病理性疼痛的发病机制复杂,且至今没有有效的治疗方法,严重影响病人的生活质量,其发病机制和治疗方法仍然是世界范围内的临床难题。γ-氨基丁酸(GABA)能中间神经元在抑制疼痛传导过程中发挥至关重要的作用。在脊髓水平,Toll样受体4(T
学位
背景钙化性主动脉瓣狭窄是老年人主动脉瓣病变的常见原因,其发病率呈逐年升高趋势,目前唯一有效的治疗方法仍然是手术。如何从发病机制着手进行干预、控制病情进展,进而促使疾病逆转是当前乃至今后一段时间亟待解决的问题。文献报道,主动脉瓣膜间质细胞(Aortic Valve Interstitial Cells,AVICs)是主动脉瓣异位钙化中成骨细胞的主要来源,而Runt相关转录因子2(Runt relat
学位
哮喘是一种常见、多发以慢性气道炎症和气道高反应为特征的异质性疾病,发病率在全球范围内都有上升趋势。哮喘患者早期症状如果不能有效控制便会持续进展,给患者家庭和社会带来沉重的医疗经济负担。目前临床上大多数哮喘可以得到有效控制,部分慢性难治性哮喘对糖皮质激素不敏感,已经成为哮喘研究中的一个难点,而气道结构重塑是哮喘难以治愈的重要原因。气道结构重塑在哮喘早期即可出现,一旦形成,便持续进展,使气道管腔缩窄,
学位
缺血缺氧导致的脑损伤是一个复杂的病理学过程,天然免疫系统的激活起到关键作用,多个信号通路共同参与其调节。天然免疫系统可以通过模式识别受体家族调控炎症反应,造成全身多个器官和系统受损,特别是对于中枢神经系统,对缺血缺氧导致的脑损伤加剧起到决定性作用。血管内皮生长因子(vascular endothelial growth factor,VEGF)的神经再生作用、神经保护作用、血管生成作用能在一定程度
学位
第一部分组蛋白甲基转移酶SETD2常被发现在多种人类肿瘤中发生突变或功能缺失。而SETD2在肿瘤发生中的作用尤其是在骨肉瘤中的作用还鲜有认识。在我们的研究中发现SETD2能够调节骨肉瘤的化疗敏感性。过表达SETD2显著提高了骨肉瘤细胞对顺铂处理的敏感性,相应地,SETD2沉默导致骨肉瘤细胞对顺铂处理更加耐受。SETD2调控Wnt信号及其下游基因c-myc,通过改变骨肉瘤细胞的干细胞特征影响其对化疗
学位
【背景及目的】肝细胞癌(hepatocellular carcinoma,HCC)是最常见恶性肿瘤之一,是困扰我国国民卫生健康的重要问题。DNA-miRNA/RNA-蛋白等多个因素的联合作用参与其发生发展全过程。微小RNAs(micro RNAs,miRNAs)是长度约15~25个核苷酸的小分子非编码RNA,在肿瘤细胞增殖、分化和死亡等诸多环节发挥关键作用,也受包括肿瘤相关巨噬细胞(tumor-a
学位
在“双减”政策大背景下,博物馆开展基于项目式学习的教育活动,有助于学生发挥学习的主观能动性,实现深度学习,培养核心素养。博物馆遵循项目式学习教育课程的开发原则,充分利用馆藏资源,创设真实的项目式学习情境,加强馆校合作,做好课程体系的规划,开发优秀的项目式学习教育课程,对有效开展教育活动具有重要意义。株洲博物馆以课程规划和课程设计为引领,对项目式学习教育课程进行开发与实践,收到了较好的效果,可为博物
期刊
研究背景:结直肠癌的发生是一种多步骤、多因素复杂作用的结果,每年结直肠癌新发病例和死亡病例均位列癌症总数的第五位,并且具有逐年上升趋势。大多数早期患者无明显症状,或者仅有轻微的腹痛、腹胀等不适;当出现明显症状时,已是中晚期,甚至失去手术机会。因此,深入研究结直肠癌发生发展中的具体机制,寻找临床诊断和治疗新靶点,有利于提高结直肠癌患者无病生存率和总生存率。以往研究显示,WWP1包含三种的结构域,即W
学位
结直肠癌是人类常见的恶性肿瘤,早期症状隐匿,中晚期治疗效果不佳。如能早发现、早诊断,有望达到好的临床治疗效果。粪便隐血试验(FOBT)、结肠镜、肿瘤分子标记物血清学和组织学检查等是中晚期结直肠癌诊断主要手段,但对早期无症状人群的预防筛选、早期诊断和疗效预测价值有限。因而开发出新的技术和方法进行结直肠癌的诊断对临床显得尤为重要。miRNAs是一种小分子核苷酸,在正常人和疾病患者体液、血液、粪便脱落细
学位
目的:研究大光斑低能量Nd:YAG激光治疗黄褐斑的效果及安全性。方法:选取我院2018年1月至2021年1月收治的黄褐斑患者125例。使用随机数字表法简单随机分为两组,其中观察组63例,对照组62例,对照组使用氢醌乳膏治疗,观察组在对照组基础上使用大光斑低能量Nd:YAG激光治疗,比较两组患者的疗效、抗氧化能力、皮肤美容效果以及皮肤屏障功能。结果:观察组患者接受治疗后的总有效率显著高于对照组(P<
期刊