主从结构集成学习分类模型及其应用研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:stonecxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是一种重要的数据分析技术,主要用于处理分类和回归任务。最常用的机器学习模型主要有逻辑回归、支持向量机、决策树、朴素贝叶斯、最近邻等。集成学习是将多个机器学习模型按照某种规则组合成一个模型的机器学习技术,它能提高单个模型的性能,是机器学习中最流行和最成功的技术之一,甚至被认为是机器学习问题中最先进的解决方案。Bagging,Boosting和Stacking是目前最主要的集成学习思想,而寻求适用范围广泛且性能强大的集成学习方法仍是目前集成学习的研究热点之一。本文针对分类任务提出了一种不同于Bagging,Boosting和Stacking的集成学习方法——主从结构集成学习分类模型(Hypotactic Ensemble Learning Classification Model,简记为HELCM)。论文从以下三个方面对HELCM的设计和应用进行了阐述:第一部分是HELCM的设计方案及理论分析。HELCM由主模型、分配器和从模型三个部分构成,其中分配器的作用是将待分类样本集按照主模型能否正确分类划分成正判集与误判集,主模型和从模型的任务分别是对正判集和误判集中的样本进行分类,以让主模型尽可能只对自己能正确分类的样本进行分类,而将主模型可能不能正确分类的样本交给从模型进行分类。由于任何分类模型都可以作为HELCM的主模型,因此HELCM还可以扩展为多层模型。理论分析表明HELCM的准确率会在分配器和从模型的准确率达到一定程度时是一定提高的。第二部分是HELCM的实验验证。在HELCM中每个部分都可以采用任何一种机器学习分类模型,各部分指定后就能构成一种集成学习分类算法。例如:主模型、分配器和从模型分别采用支持向量机、最近邻和朴素贝叶斯的HELCM可以称为HELCM(支持向量机-最近邻-朴素贝叶斯)算法。实验设计了以最近邻模型和梯度提升树模型作为分配器的多种HELCM,并在两个标准数据集上做了测试,实验结果表明,HELCM优于基线模型和现有的三种集成方法,能获得更高的预测准确率,证明了HELCM的有效性。第三部分是HELCM的应用实例。将现有的分类算法和主从结构集成学习分类算法应用在航空客户流失预测上。同样构建了以最近邻模型和梯度提升树模型做分配器,分别用十种不同的算法构建主模型和从模型的HELCM,然后将其与基线模型进行了比较,发现在航空客户流失的预测上,HELCM往往能取得更高的准确率。
其他文献
通过梳理古代和现代针刺补泻手法文献,分析其实施基础和力学要素。结果提示,穴位力敏现象为针刺疗法这种机械力刺激方法提供了有效性的基础。针刺操作过程的力学要素是:针刺进入穴位力敏区域是发力指征,得气感到达目标病位是发力停止指征,针灸针的运动幅度是力的作用距离,提插补泻手法的核心力学参数是力的方向,捻转补泻手法的核心力学参数是力的大小。将针灸针受力的过程用发力指征、力的大小、力的方向、力的作用距离和发力
期刊
高校共青团服务大学生创新创业是大学生创新创业良好开展的重要支持工作,高校共青团与大学生之间能够形成良好的沟通,从而帮助大学生创新创业解决问题。但是,通过共青团服务大学生创新创业工作实践开展的现状调查发现,共青团服务大学生创新创业还存在有一定的问题,包括体制机制不完善,队伍建设不健全等问题,都影响共青团的创新创业服务质量。综上,为了能够实现高校“三全育人”的总体目标,高校教育工作开展更应该注重利用共
期刊
榛子为桦木科榛属植物,与核桃、腰果、扁桃并称为“四大坚果”,享有“坚果之王”的称号。榛子食用之后,其壳和果苞大多作为农林废弃物直接丢掉,造成资源的浪费,而榛子壳含有大量绿色食品所拥有的天然色素、多糖、酚类等物质,同时它还是一种可再生资源,也是环保领域研究的生物质原料,榛子果苞含有多种化感物质,具有潜在的抑菌、抗炎、抗氧化活性。为了提高榛子的利用率,本研究以榛子壳和榛子果苞为实验材料,对其总酚酸、总
学位
<正>随着生产力的提升,人类社会的经济形态已经从产品经济、商品经济、服务经济,逐渐过渡到体验经济阶段。企业间的竞争不再是简单的质量、价格或产品差异化比拼,而是客户体验的较量。对于为信息社会提供基础设施服务的通信运营商而言,客户体验更是企业生存发展的核心要素,优化客户体验管理,实现客户感知提升,对企业未来发展大有助益。
期刊
自然灾害给社会造成严重的人员伤亡、环境破坏、设施损毁等损害,同时也会带来社会心理、社会行为等干扰与破坏,形成危及社会稳定安全的社会风险。自然灾害社会风险生成演变需要满足一定的条件,这主要由自然灾害危害程度、社会风险载体脆弱程度、社会韧性能力等因素决定。这些因素推动社会风险向着蕴藏期、显露期、蔓延期和消减期四个阶段演变。自然灾害社会风险在其演变过程中又会呈现出一定的规律性,主要表现为:在社会风险承担
期刊
近年来,国内三家电信运营商在国际电信业整体低迷的态势中实现了逆势增长。2022财年国内三家电信运营商业绩表现持续领跑全球,并且在营收规模、盈利能力、用户增长等各方面增势强劲,云计算、5G专网等产业数字化业务快速发展并成为国内运营商的第二增长曲线。本文通过剖析国内三家电信运营商强劲业绩表现背后的主要发展动能,总结其差异化发展路径和数字化关键能力,并从数字化战略、研发创新、体制改革等多个层面提出相关建
期刊
新浪微博评论内容包含用户对社会事件的看法、态度、情感倾向等,其中蕴含着十分丰富的情态信息。为把握舆情走向,提升公共舆情治理能力和公共服务质量,本文以“7·20”河南暴雨事件为例,选取人民日报微博客户端在事件期间发布的相关微博,以其微博文本和评论为基础进行舆情文本情感分析及主题提取,结合数据分析得出事件舆情特征,并讨论相关管理部门应如何针对突发事件进行舆情治理,构建健康绿色的网络环境。
期刊
随着人类活动范围和强度不断扩大和提高,地球环境变化加快,21世纪以来,自然灾害呈多发频发势态。自然灾害从酝酿—发展—产生—消亡,是一个动态变化发展的过程,其风险也是动态变化的,文章研究了五种类型的风险及其变化规律,有助于我们有针对性地采取措施,管控风险,减少、降低或者消除对人民生命财产的威胁,真正做好防灾减灾工作。
期刊
车联网通过对收集到的信息做相应处理,使系统达到辅助驾驶的功能。虽然利用这种方式能够为人们的出行带来便利,但由系统自身的网络开放性以及拓扑结构的易变性所引发的安全问题也因此变得日益突出。为了解决系统内存在的安全问题,就需要保障数据的完整性以及用户身份信息的隐秘性。签名认证的引入保证了数据的真实性以及完整性,而身份的匿名化的引入则完善了对用户身份信息的隐私保护,所以车联网中匿名认证方案的实现成为本文研
学位
以学生为主体,坚持“立德树人”根本任务,实现全员、全程、全方位育人,全社会“大思政”格局已经基本形成。面对个性迥异的新时代青年学生,高校共青团的职能在不断地创新和发展,共青团协同育人的功能顺势而生。通过分析高校共青团协同育人的成效、问题及原因,提出实现“大思政”格局下协同育人的有效路径,创新协同育人模式和过程,开展丰富多彩的协同育人活动,形成高校思想政治教育的育人合力,更大广度、更大力度、更大效度
期刊