自适应森林优化特征选择算法及应用研究

来源 :常州大学 | 被引量 : 0次 | 上传用户:xiaojing795130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据用于给机器学习以及数据建模提供更多的信息,但同时带来了“维度灾难”、“数据稀疏”等问题。特征选择方法是一种典型的数据降维技术,能够从原始特征集中选择最佳特征子集,缩减数据规模,同时保留特征物理意义。森林优化特征选择算法表现出色,但存在的初始化方法的盲目性以及更新机制的局限性等问题限制了算法的性能。针对这些问题,本文对森林优化特征选择算法进行改进,有效优化特征选择。本文的主要研究内容如下:(1)针对森林优化特征选择算法存在的不足之处加以改进,提出自适应森林优化特征选择算法。在初始化过程中,加入特征权重评估算法,提出特征相关的自适应初始化策略;在更新机制上,使用自适应参数选择策略替代原始的更新机制,根据当前最优树的质量和迭代次数,动态确定参数值。在不同维度的UCI数据集和不同分类器上进行实验,结果表明:自适应森林优化特征选择算法有效提升了分类准确率,在中高维度数据集中,所提算法与支持向量机有较好的适配度。(2)本文在(1)的工作基础上,针对研究中发现的维度缩减率效果较差的问题,提出了自适应混沌映射森林优化特征选择算法。首先使用混沌映射算法生成能够充分覆盖解空间的初始森林;其次对适应度函数进行改进,使用自适应思想,在算法迭代前期,考虑算法的分类准确率,在迭代后期,加入优化维度缩减率的考虑。实验结果表明,在中高维度数据集中,自适应混沌映射森林优化特征选择算法在不降低分类准确率的同时,能够获得较小的特征子集。(3)为了验证本文提出算法的有效性以及进行相关应用研究拓展,选用田纳西-伊斯曼过程数据集进行故障检测实验。将(1)中提出的森林优化特征选择算法与支持向量机结合,构建一个动态过程的在线故障检测框架。首先在数据处理阶段,通过缩放将特征中的异常值限定在特定范围内,以此消除异常值影响,从而提高模型泛化能力。然后使用森林优化特征选择算法进行特征选择。最后使用多分类支持向量机进行故障检测,多分类支持向量机中每个分类器对应一个特定的故障,同时能够提供接口来更新故障数据库。实验结果表明,在具有高度非线性特征的故障案例数据集中,该框架不仅能够有效筛选出数据集中的优质特征,同时也提高了故障检测的准确率。
其他文献
人类行为识别是计算机视觉领域的一个活跃的研究领域,包括公共安全监控、生物识别、人机交互、体感游戏和自动驾驶等领域。本文从人体运动特征表示和时空图卷积网络等方面对人体行为识别做深入研究。图卷积网络(Graph Convolutional Networks,GCN)在骨架视频动作识别方面取得了显著的性能。然而现有的基于GCN的方法大多是通过增加模型参数来提高性能。这些模型的训练需要大量的数据,所以它们
学位
随着城市智能化水平的提高,轨迹预测技术能准确预测行人未来轨迹,用以减少碰撞避免人车冲突。现有的轨迹预测技术虽然能实现简单场景内的行人轨迹预测,但在面对人员密集,干扰因素众多的复杂场景时,依旧存在着诸多问题和挑战。本文主要研究复杂场景下人与环境交互过程的内在逻辑,推测行人可能的运动目标和通过路径,在此基础上实现对行人未来轨迹的精确预测。本文提出三种行人轨迹预测器:一种学习潜变量的对抗性轨迹预测器、场
学位
再认记忆是人类重要的认知能力之一,脑电图的出现使得再认记忆的研究迈入了新的阶段。但目前关于再认记忆的脑电研究,大多着眼于事件相关电位(ERP)和行为数据分析,并未从脑功能网络角度研究再认记忆。本研究使用128导联EGI脑电采集系统,采用新旧图片再认范式,共记录了36名医学生与37名非医学生的事件相关脑电信号,研究两组受试者在对新旧图片进行再认时的大脑功能连接差异。首先,将数据分为8个子频带,采用相
学位
许多智能手机和智能可穿戴设备已经配备了多个传感器(如加速度计和陀螺仪),传感器数据更加易于获取。凭借这些优势,基于可穿戴传感器的人类活动识别近年来受到了越来越多的关注。目前,大多数的研究都是单一基本动作的识别,忽略了过渡动作的影响;对于动作的识别提取单一的统计特征,依据经验选取分类器,因此针对不同动作选择特征以及分类器的问题,提出了多特征以及多分类器的分类模型;还针对小样本的传感器数据提出自注意力
学位
抑郁症的传统量表诊断方法存在患者否认、主观偏见等缺点,同时药物、物理和心理治疗方法存在副作用大、记忆损伤严重、过分依赖医师能力等缺点。因此,无创、便携的脑电(EEG)测量技术,结合高沉浸感的虚拟现实(VR)技术,对于抑郁症的分类识别和康复训练研究具有重要意义。在抑郁症分类识别方面。首次采用相干性虚部(IC)构建Alpha、高Beta、Gamma频段的脑网络,进行连通性分析,并提取传统图论特征集。同
学位
随着我国公共基础设施的快速发展,混凝土作为建筑物的基本原材料被广泛使用,裂缝作为混凝土设施最为常见的结构性病害成为建筑工程质量中健康检测的重要一环。传统的检测方法,如人工检测,存在检测效率低、检测结果不准等问题;基于数字图像处理技术的检测算法,存在需要人工设计特征、模型稳定性差、易受环境干扰等局限。基于此,本文着力于研究基于计算机视觉的智能裂缝检测算法。本文选用具有编码器-解码器以及跳跃连接结构的
学位
行人轨迹预测是自动驾驶技术的重要组成部分,其在智能运输、视频监控、智能安防等领域有着潜在的应用价值。由于行人之间存在着复杂的交互行为,行人轨迹预测仍是一个挑战性的问题。研究者为有效建模行人间复杂交互,提出将行人看作图中节点建立图网络,应用图神经网络学习行人之间交互影响,提高行人轨迹预测精度。然而,将图神经网络作为预测网络的隐层,图神经网络容易出现过平滑,网络难以训练等问题。本文针对上述问题通过分析
学位
近几年,智能手机内置的运动传感器对人员动作进行识别成为可能,常应用于家庭长辈动作健康监测,儿童安全保护等领域。在这些使用环境下,基于惯性传感器的人员动作识别方式具有其他人员动作识别方式不具有的优点,例如难以长时间被模仿,保护个人隐私,便于分析检查等。但是,针对日常生活中连续动作类型的信号时,对其进行精确分割和识别的效果仍略有不足。大多数的研究局限于时域特征和简单频域特征,而且仅对独立的单个动作进行
学位
目的:探讨血清低密度脂蛋白胆固醇(LDL-C)、C反应蛋白(CRP)水平与老年阻塞性睡眠呼吸暂停综合征(OSAS)严重程度的相关性。方法:选择OSAS患者132例为研究对象,根据睡眠暂停低通气指数(AHI)不同将患者分为轻度组(AHI为5~14.9次/h,n=41)、中度组(AHI为15~29.9次/h,n=45)和重度组(AHI≥30次/h,n=46)。另选取同期排除OSAS的40名老年体检者作
期刊
近年来,区块链技术凭借去中心化、信任机制等特点被应用于智慧交通、医疗保健等领域。其中,部分区块链通过工作量证明(Proof of Work,PoW)共识算法实现区块共识。然而,目前国内外学者主要侧重于区块链的快速应用研究,较少投入力量分析区块链的本身安全问题。同时区块截留攻击作为矿池挖矿攻击手段,只需要攻击者合理分配攻击算力便可以降低矿池的正常收益,对PoW共识产生严重危害。因此,区块截留攻击下矿
学位