基于强化学习的不平衡分类问题及其耦合关系研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:wuai000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化建设的提高,各企业单位、政府机构积累了大量数据,如何合理利用科学的数据挖掘方法对数据进行预测、分类是提高生产能力的关键所在。面对纷繁复杂的大量数据,如何将数据价值进行充分挖掘是数据工作的核心。因此,分析和研究数据对象以及与之相对应的数据挖掘模型是各行各业创新发展的重点。不平衡数据广泛存在于各种真实业务场景中,例如股价涨跌时间序列数据、医疗诊断数据、客户流失数据等。由于数据的不平衡性以及多噪声、数据分布重叠等问题,传统的机器学习模型面对不平衡学习时往往会难以达到令人满意的效果,甚至无法学习。另一方面,数据不平衡性带来的困难还在于少数类的误分,错误的将少数类划分为多数类,而真实数据中,少数类往往具有更高的价值。为了解决数据不平衡性导致的困难,学术界提出了一系列针对不平衡数据的算法模型,由于这些算法存在破坏数据分布、无法自适应数据、面对噪声不稳定等问题,效果不尽如人意。本文首先分析了模型误差分布与分类边界的交互效应,基于该分析结合动态分类器系统提出软性采样动态分类器集成选择算法,并将该算法由重采样推广至重赋权。最后,本文将采样参数作为元参数从模型中解耦,构建元采样器,并以强化学习算法训练元采样器,实现模型与数据的双重自适应学习。本文所做工作主要有以下几点:本文利用具有不同误差分布特征的数据子集训练多个同构分类器,并绘制各分类器的决策边界可视化图,对模型误差分布与分类边界的交互机制进行分析。通过分析可以发现分类边界会随数据子集的不同发生偏移,并且使用多数类困难样本训练得到的基分类器具有更清晰、细腻的决策边界。整体上看,基于误差分布训练得到的基分类器呈现区域性、多样性特征。本文在基分类器多样性分析的基础上提出柔性采样动态分类器集成选择模型。模型包含两个算法,基分类器生成算法与动态预测算法。基分类器生成算法兼顾了静态集成学习的偏差与方差优势,同时具备多样性与区域性。本文提出的动态预测算法基于分类器评价函数,通过评价预测点的邻域内各基分类器的性能表现动态的赋予预测权重,增强了多分类器系统的局部信息挖掘能力,同时,评价函数将分类器在预测点的置信程度纳入评价函数考察因素,提高了评价机制的合理性。本文对柔性采样动态分类器集成选择模型进行了参数敏感性检验,结果表明柔性采样动态分类器集成选择模型对特定范围内的参数鲁棒,针对该结果,本文给出了柔性采样动态分类器集成选择模型的参数取值意见。本文亦将柔性采样动态分类器集成选择模型与动态分类器系统领域、不平衡集成学习领域的代表性算法在真实数据集上进行性能实验,实验结果表明柔性采样动态分类器集成选择模型具备最优性能,具有稳定性与准确性。为了推广柔性采样动态分类器集成选择模型的应用情景,本文将柔性采样动态分类器集成选择模型的基分类器生成算法进行推广,提出了柔性赋权动态分类器集成选择模型。与柔性采样动态分类器集成选择模型不同,柔性赋权动态分类器集成选择模型将多数类入样概率推广为多数类样本权重,并设计代价敏感因子平衡类别偏差。本文将柔性赋权动态分类器集成选择模型与柔性采样动态分类器集成选择模型在公开数据集上进行性能实验,实验结果表明二者的分类性能接近,得益于训练样本的上升,柔性赋权动态分类器集成选择模型的性能存在微弱的优势。本文将柔性采样动态分类器集成选择模型的采样参数解耦,设置为元参数,训练元采样器指导集成框架学习。本文基于对模型误差分布的认识,设计了包含训练进程、误差分布等信息的元状态,并塑造奖励函数,以强化学习算法训练元采样器,元采样器与集成框架组成了元柔性采样动态分类器集成选择模型。该模型实现了对数据和模型的双重自适应学习,并且具备跨任务迁移能力。本文在真实数据集上对元柔性采样动态分类器集成选择模型进行性能实验,实验结果表明,元柔性采样动态分类器集成选择模型的分类性能与柔性采样动态分类器集成选择模型接近,并且有一定程度的提高。最后,本文对元柔性采样动态分类器集成选择模型进行了跨任务迁移实验,实验结果表明,元学习器具备跨任务迁移能力。
其他文献
近年来,随着中国商业健康保险市场的蓬勃发展,人们对健康保险的需求得到了不同程度的满足。根据中国保险协会的数据,按照过去五年37%的年均增长率计算,到2020年全国医疗保险费收入将超过1万亿元。商业健康保险会随着经济水平的发展而发展,但由于当前区域经济发展不平衡的状况仍然十分突出,且不同地区的人文环境和自然环境存在差异,发展必然存在区域差异。这将制约商业健康保险的全面和科学发展,对我国保险业乃至经济
学位
随着社会发展和大众健康意识的增强,零售药店在大众日常生活中扮演着越来越重要的角色,而医药连锁企业规模也在不断发展扩大,导致近年来零售药店数量激增,药品零售企业间的竞争逐渐增大。因此,通过数据挖掘充分利用销售管理过程中产生的海量数据,对企业合理配置资源、促进企业高效运转进而提高企业竞争力意义重大,合理的销售预测对企业的采购、配送和库存管理等方面都会产生深远的影响,同时对企业做出销售决策,优化供应链管
学位
高维数据在日常生活中越来越普遍,使得数据利用难度增加,信息利用复杂度和成本也增加,而对高维数据进行降维是一种比较有效的方法。主成分分析(PCA)是一种具有代表性的降维方法,通过将一组变量转换为一组无关的综合变量实现降维。然而,传统的PCA基于l2范数,对异常值表现敏感,当数据中存在异常值时,会影响模型的参数估计。为了解决这个问题,基于l1范数的PCA被提出以找寻更稳健的解。其中,基于l1范数主成分
学位
在卷烟产品生产过程中,机器故障、生产条件等因素会导致烟支褶皱、扭曲变形、刺破、污点等外观质量问题。因此,如何快速、准确地检测烟支外观缺陷,对烟支产品质量的保障具有重要意义。目前,烟支外观缺陷的检测手段主要依赖传统图像处理和人工检测。然而,这些方式存在难以识别未知缺陷、检测效率低以及检测结果容易受人为因素影响等问题。针对这个问题,本文提出了一种基于改进YOLO深度学习模型的烟支外观质量检测方法。该方
学位
如今是一个大数据快速发展的时代,数据的重要性日益递增,如何获取到数据中更多的有效信息成为了研究关注的重点,所以数据挖掘这个领域逐渐突出。在数据挖掘这个领域当中有一个研究热点——数据分类,而数据分类的传统理论研究中常常假定数据集是平衡分布的,但是在实际生活中存在大量分布不均衡的数据集,所以这类数据的分类效果并不是太好。在这类不平衡数据集中,少数类样本更具有重要性,少数类样本被误判所造成的损失往往远远
学位
在医药产业库存优化管理中,连锁药店销售预测具有应用潜力。然而,连锁药店销售预测在数据质量和时间序列特征等方面具有复杂性,使用传统的集成学习预测仍然存在显著的局限性。本研究旨在结合连锁药店零售的特点,探讨并改进原始集成学习在此应用场景下存在的不足。本文对销售预测文献进行深入的研究和分析,着重探讨其思想提出、实施方法与应用等方面,为实现精准稳定的连锁药店销售预测模型提供了理论支撑。本研究的主要内容包含
学位
党的十八大以后,实施全面深化医疗卫生体制改革,我国医疗卫生事业迎来高速发展,但在医疗资源管理、保险赔付政策制定等方面,仍有诸多问题亟待解决。而住院时长是衡量住院患者资源消耗的重要指标。因此,医院要解决患者住院周期长和病房床位周转率低的问题,精算人员欲科学设定住院医疗保险的免赔期、最长补助天数,提高医疗水平的同时减轻患者负担,对患者住院时长的深入研究很有必要。又结合到恶性肿瘤造成的疾病、经济负担均较
学位
在经济社会及理论研究中,同步和合作行为是广泛存在的,已有许多学者对同步或合作行为分别进行了研究,但却较少有研究将两者相结合。事实上在现实生活中,由于个体间交互通常需要付出成本,合作与同步之间是存在耦合关系的。因此本文就针对合作与同步的耦合关系,在Kuramoto模型的基础上,建立了包含同步与合作的更符合现实意义的模型。同时运用最优选择的方法,观察并探究在不同的最优选择参数下,合作率以及同步率的变化
学位
随着我国经济快速增长,城镇化发展进入到新阶段,高质量成了必然要求,可持续的城镇化也成为了发展目标。而由于人口、产业等不断向城市转移,资源不断被消耗,生态环境不断被破坏,实现可持续城镇化任重道远。国土空间规划是城镇化建设的关键,关乎城镇化发展水平,因此需要把握可持续城镇化与可利用国土空间之间的关系,以期能实现两者协调,助力城镇化发展和国土空间优化,这对实现可持续的城镇化具有重要意义。就此背景本文对我
学位
博弈论,是探讨种群斗争或竞争问题的经典数学理论与方法,是现代数学和运筹学的重要组成部分。随着理论发展,经典博弈论与生物理论中的进化思想结合,形成演化博弈论。由于该方法能较好地描述种群演化动态,演化博弈论成为近代进化生物学最重要的理论之一,并逐渐应用到社会、经济等多个领域。然而在以往的研究中,演化博弈分析大多基于环境条件恒定、参与者对称互动的假设,这两个假设并不能很好地模拟现实环境。首先,在现实生活
学位