求解分类问题的头脑风暴优化算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:khl0907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘和机器学习领域中最基本、最具代表性的问题,精准且高效的分类是许多科学研究和应用工程的基础。进化计算(Evolutionary Computation,EC)技术由于具有较好的全局寻优能力,已成功地应用于解决许多问题,例如:分类问题,特征选择问题等。其演化出的进化分类模型便是用于求解分类问题的方法之一。近年来,头脑风暴优化算法(Brain Storm Optimization,BSO)被用来实现进化分类模型,并取得了预期的效果,这意味着利用EC技术直接求解分类问题是可行的。然而,现有的进化分类模型仍存在一些不足。例如,进化分类模型的结构与数据集的维数密切相关,而在实际的数据集中往往存在着大量冗余、不相关或噪声的特征,这可能导致计算繁复、学习效率低下,从而影响模型的分类性能。此外,在优化过程中,BSO算法在寻优过程中不能很好地保留优势解的信息,这也可能导致其分类性能受到限制。为从不同角度优化进化分类模型的性能,进而更好地求解分类问题,本文主要做了以下研究工作:(1)进化分类模型结构的复杂性完全依赖于数据集的维度。从优化进化分类模型的结构,提高分类模型性能的角度出发,本文引入了特征选择的概念,提出了两种基于特征选择的进化分类模型:基于结构的进化分类模型和基于结构及其权重参数的进化分类模型。1)基于结构的进化分类模型以最高分类准确率为目标函数,利用BSO算法的全局优化能力,不断搜寻具有更高分类准确率和更小解的最优特征子集(模型结构),使得在确保分类性能的同时降低模型结构的复杂性。2)由于不同的特征子集均有其相应的最优权重参数,但在搜索最优特征子集的过程中,并没有搜索与之相对应的最优权重参数,易导致损失较优特征子集。在此基础上,本文进一步提出了基于结构及其权重参数的进化分类模型。一方面,利用BSO算法搜索最优模型结构;另一方面,利用BSO算法搜索不同结构下的最优权重参数,以防止因权重参数的不匹配而丢弃更优的特征子集。文中通过实验验证了这两种引入特征选择来降低模型结构,进而改善模型分类性能方法的有效性。(2)针对BSO算法寻优能力的局限性,改进BSO算法的搜索策略,提出改进的头脑风暴优化算法(Improved Brain Storm Optimization,IBSO)。在IBSO算法中,通过保留BSO算法的头脑风暴过程,将全局最优、局部最优以及最近邻三种搜索策略嵌入到BSO算法中,既可以更好地保留了优势解的信息,又增加了优势解之间的信息交换,提高了算法的局部开发和全局探索能力。此外,在针对BSO搜寻最优特征子集的过程中,我们使用了四种传递函数来约束特征子集的值域处于二元值区间中。实验结果验证了IBSO算法中的三种搜索策略具有较好的性能,可以改善BSO算法中在求解分类问题时的能力。
其他文献
地物覆盖监测在土地资源管理、生态系统保护和可持续发展等方面发挥着越来越重要的作用。利用遥感数据进行地物覆盖分类是量化土地资源并监测其变化的有效方法。作为新型的主动遥感技术,多光谱激光雷达(light detection and ranging,Li DAR)系统可同时获取地物的表面几何和光谱信息,已成为一种快速获取大范围空间数据的手段,为环境建模、灾害响应、地物覆盖分类等研究提供新的数据源。然而,
随着社会经济的发展,雾霾污染变的日益严重,对人们的生活造成了严重的影响。PM2.5作为雾霾浓度数据中的主体,受到了学术界和工业界的广泛关注。目前已有大量的PM2.5预测模型被提出。然而,PM2.5的来源的多样性给准确的预测出其浓度值带来了挑战。不仅如此,雾霾污染数据具备线性化,差分化的特点,普通的预测方法无法兼顾这些特点,这也给雾霾预测带来了挑战。为此,本文从雾霾特征的角度出发,通过寻找各特征间的
大气电场是大气电学的基本参数,晴天时地面具有垂直向下的大气电场,雷暴天气时地面大气电场显著增强。地面大气电场的观测和研究对减少雷电灾害、大气电学研究、保障航空航天活动具有重要的意义。大气电场仪是测量大气电场的基本仪器。大气电场仪的有效标定、数据修正和异常值检测是提高观测数据质量的重要手段。大气电场信号具有非平稳信号的特征,利用非平稳信号处理方法,结合机器学习算法,分析不同天气状况下的大气电场,为雷
现有的基于深度学习的近重复图像检测算法主要依赖于CNN(Convolutional Neural Network,卷积神经网络)特征。相比于传统的手工设计特征,虽然一些基于CNN特征的近重复图像检测算法取得了较大的提升,但现有的方法往往单一地提取图像的全局CNN特征或者局部CNN特征,未充分结合考虑全局CNN特征和局部CNN特征的优点,因此在检测的准确率和效率上仍存在较大的提升空间。并且对于近重复
常规无线探空仪通常搭载高精度温度、湿度传感器、气压计等传感器,对大气温度、湿度、压力等因素进行测量。为了克服探空仪出云、入云后,水分子以冰晶或水滴的形式覆盖在湿度传感器表面从而影响湿度测量的精度问题,本文设计了一种双加热湿度传感器;同时,为了研制高精度、低成本的总辐射传感器,本文提出了一种带有铝制防辐射罩的热电型的总辐射传感器设计。通过两种传感器对高空温度、湿度、辐射强度的测量,旨在对常规探空仪上
短期降雨预测一直是气象预测中十分重要的研究课题,高效、准确的降雨预报为人类活动、国家安全提供有效的科学依据。近年来,深度学习在气象预测方面的研究取得的成果显著,很多深度学习的短期降雨预测模型已经超过大多数传统的降雨预测模型,但是深度学习模型本身还有很多值得改进的地方。目前很多气象中心获得的气象数据大多来自于多个观测站点,这些多站点数据具有高维性和混沌性,要对这些数据进行有效的建模,还需要模拟出数据
随着无人机技术的成熟与发展,无人机被广泛应用于军事和民用领域。然而,无人机也十分容易遭受恶意的攻击,导致严重的后果。无人机的视觉系统在避障、跟踪、定位等方面发挥着巨大的作用,是无人机安全的重要保障,但是很少有研究者对它的安全性进行研究。因此,本文从攻击者的角度对无人机视觉传感器的CMOS和检测模型设计了两种攻击方法,旨在研究无人机视觉系统的安全性。本文的具体工作如下:1)针对无人机视觉传感器的CM
多目标优化问题普遍存在于科学研究与工程应用中,其由多个相互冲突的优化目标组成,往往一个目标性能得到提升时会导致其它数个目标性能的下降。当目标空间维度超过3时,称之为超多目标优化问题;当决策空间维度超过100时,称之为大规模多目标优化问题,以上两类高维优化问题是当前智能计算领域的热点课题,具有重要研究意义。多目标优化属于NP难题,难以在有限的时间内计算出最优解,所以通常利用多目标进化算法快速地搜索出
域适应作为机器学习的新兴领域之一,目前已在语义分割,图像检测等方面取得了广泛的应用。在域适应中,通常目标域样本完全无标签,这种场景被称为无监督域适应(UDA)。当前,尽管已有许多UDA模型被提出,然而这些方法大多只考虑源域信息如何利用,没有从更深层次挖掘域之间的关系信息,这为本文留下了改进空间。此外,随着域适应场景中源域可获得信息逐渐减少,逐渐诱导出无源域适应,完全无监督域适应等场景。为此,本文尝
在“十四五”规划中重点强调了高性能MEMS传感器的研制。鉴于传统的硅基MEMS压力传感器普遍具有温度漂移和时间漂移等缺点,本文从抗干扰的角度出发,基于信噪比理论对MEMS压力传感器芯片进行了结构设计,并结合恒温控制和恒流源自校正方法显著提升了其性能,论文的主要研究内容如下:首先,理论分析了基于惠斯通电桥结构的压力传感器工作原理,简介了传感器温漂和时漂产生原因。通过ANSYS模拟仿真设计了多种压力传