基于智能计算的特征选择研究

来源 :福建农林大学 | 被引量 : 0次 | 上传用户:whfbbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是机器学习领域的一个重要课题。随着数据获取技术的快速发展,高维数据集越来越普遍,但并不是所有的特征都与分类目标相关。不相关和冗余的特征甚至会降低分类性能。特征选择作为数据挖掘和机器学习中一种重要的数据预处理方法,旨在选择较少的相关和非冗余的特征,以获得与使用所有特征相似甚至更好的分类性能。特征选择本质上是一个NP难问题。随着维数的增长,搜索空间呈指数增长,因此进行穷举搜索是不切实际的,而元启发式搜索技术被认为是替代传统优化技术寻找最优解的有效手段。人工蜂群(Artificial Bee Colony,ABC)算法作为一种元启发式算法,因其鲁棒性强、结构简单、控制参数少、空间探索能力强等优点已被成功应用于众多领域,但在特征选择方面的潜力尚未得到充分研究。本文提出一种基于ABC算法的方法来进行分类问题的特征选择。针对ABC算法收敛速度缓慢,开发能力不足、内存浪费等缺点,本文引入了一种新颖的基于层次的学习机制,将种群划分为若干个层次,各蜜蜂须向更高层次的较优蜜蜂学习;为了在不同的搜索阶段动态地调整算法的探索和开发能力,进一步提出了一种基于种群多样性的自适应层数确定法。此外,采用了一种准确度优先的更新策略,以获得错误率最低且特征数最少的最优特征子集。在12个广泛使用的高维数据集上与8种最先进的特征选择技术进行比较,实验结果表明改进后的ABC算法在分类精度、特征子集大小和计算时间方面均表现出优越性。对于元启发式算法,探索和开发的良好比例是确保成功解决特定优化问题的最重要标志。本文采用了基于多样性测量的实验分析方法,对改进后的ABC算法的探索和开发能力进行定量评价;并进一步评估了基于层次的学习机制、自适应层数确定法以及准确度优先的更新策略对于平衡算法探索和开发的贡献。实验结果表明上述改进有效提升了ABC算法的开发能力,并在搜索过程中实现了全局探索和局部开发之间的动态平衡。现有的大多数CNN架构搜索都是基于CNN组件或构造良好的块,这两种方法通常会生成无效的CNN架构或泛化能力较差的复杂CNN架构。针对此问题,本文基于改进后的ABC算法,提出了一种自动卷积神经网络(Convolutional Neural Network,CNN)架构设计方法,以有效解决图像分类任务。主要通过为ABC算法设计一种新的编码策略来对任意深度的CNN进行编码,以解决架构搜索中无法预知最佳CNN深度并指定编码长度的难题。同时结合跳跃连接促进产生更深的CNN以提升模型的泛化能力。在广泛使用的基准图像分类数据集上对该模型的性能进行验证,实验结果表明,该模型在分类精度、参数数量和消耗的计算资源方面优于现有的自动CNN架构设计算法,甚至能够取得与自动设计+手动调整CNN方法非常相近的分类精度。
其他文献
<正>2021年,长三角三省一市共同发布了服务业高质量发展的宣言,产生较大影响。2022年,长三角三省一市又共同发布了服务业高质量发展行动计划,一张蓝图绘到底,把服务业高质量发展推向了一个新高潮。党的二十大报告提出,构建优质高效的服务业新体系,推动现代服务业同先进制造业、现代农业深度融合,
期刊
随着信息时代的到来,数字技术得到了迅速的发展,数据的规模也呈现出指数式增长。海量的数据催生了大数据时代,同时也带来了“维数灾难”。直接处理高维数据是费时费力,因此需要在高维数据中提取出有效的低维表示。主成分分析(PCA)是高维数据分析中最著名降维方法之一。但是,传统的PCA是一种面向一维数据的非概率特征提取方法,因此它难以处理二维数据,缺失数据,以及具有离群点的数据。双线性概率主成分分析(BPPC
学位
近年来福建省制造业发展一直保持良好的增长势头,作为制造业大省,福建省制造业在全省工业中占有重要地位。为了全面实现智能化、数字化、信息化的发展要求,福建省制造业面临着转型升级的压力。经济发展的新时代背景下,福建省一定要迎合时代需求,牢牢抓住当前数字经济与制造业融合发展这一难得的历史机遇和战略窗口期。因此,探究福建省数字经济发展水平对制造业升级的影响,具有十分重要的理论和实践意义。本研究以福建省为研究
学位
随着数字信息与云存储技术的发展与成熟,密文域可逆信息隐藏算法正逐渐成为通信传输中数据隐私保护的研究热点。如何根据不同载体图像像素的分布特征,对局部区域内像素进行自适应识别编码,实现对载体更彻底的压缩以提升嵌入容量仍具有较大挑战。本文针对密文域可逆信息隐藏算法因载体图像冗余空间压缩不充分而导致嵌入容量较低的问题,提出一种基于差分编码和块压缩的密文域可逆信息隐藏算法。首先根据自然图像局部区域内像素强相
期刊
在大力构建新发展格局的背景下,维护国内的经济金融稳定已然成为了中国金融监管工作的首要目标。为探索双支柱政策对平抑金融周期的协调效果,首先,本研究通过CSMAR数据库采集并测度2002年1月~2021年3月中国信贷规模增速、杠杆增速、房地产价格增速和股票价格增速数据。其次,采用BP滤波法和主成分分析法提取、测度中国金融周期指数并对金融周期分项指数和金融周期总指数的波动特征展开分析。接着,本研究选取I
学位
多幅(帧)图像信息融合通过特定的算法将来源于同一场景的两幅或多幅图像的信息综合成一幅新的图像,从而能够获得比单一图像更丰富的信息,增强人们的视觉感知。多幅图像融合和多帧图像超分辨率是这一思想的两个问题。其中来自不同波段的多幅图像融合实现了不同波段的信息互补,而多帧图像超分辨率则通过融合相关帧序列增强图像的空间分辨率。在不同波段图像融合方面,红外与可见光图像融合是关注焦点之一,通过长波通道的红外图像
学位
以高质量发展为主题、以改革创新为根本动力已经成为应对中国经济发展新常态、破解发展难题的主要抓手。东部地区在经济总量和创新资源数量上都在全国占据绝对优势,对带动全国推进高质量发展具有示范引领作用。实现经济高质量与创新要素配置效率协同发展,是东部地区率先实现高质量发展面临的重要问题。本文在系统梳理经济高质量发展与区域创新效率耦合作用机理的基础上,从综合效益、协调发展、绿色发展、开放发展、共享发展五个方
学位
高质量的特征匹配选择是在给定的初始特征匹配集合中寻找正确的特征匹配,是计算机视觉中一项基础且重要的任务。其是许多高层次计算机视觉任务的基础,如图像配准、三维重建、闭环检测、图像拼接、三维目标识别等。因此,高质量的特征匹配选择结果的好坏会对后续的计算机视觉任务产生直接的影响。同时,由于高质量的特征匹配选择问题在本质上是一个十分复杂的组合优化问题,特别是在待处理的数据量较大且外点率较高时,其计算复杂度
学位
5G技术、物联网、大数据、云计算和人工智能等互联网技术的出现,推动信息化的发展进入大数据时代。面对海量数据的浪潮,决策问题在大数据背景下往往呈现出多样性、模糊性以及复杂性。如何完整表征这些复杂信息并对决策评价进行合理地聚合,是现代决策理论与方法领域中的一项重要研究课题。模糊集理论作为决策理论研究中处理不确定性的一种强有力的数学工具,在处理不确定信息方面具有独特的优越性。在大数据背景下,为使多属性决
学位
显著性目标检测是模拟人类的视觉特点提取单幅图像中最感兴趣的物体,即显著性物体。基于深度学习的协同显著性研究旨在检测多张图像中同时出现的显著性物体。该任务存在两大难点:(1)如何针对不同视觉场景中的不同物体得到鲁棒的特征表达。(2)如何通过这些特征表达进一步建模同组图像的共识关系,利用组内语义一致性来提升协同显著性检测的性能。现有的协同显著性研究对上述难点进行了深入研究,但因实际检测场景受到遮挡、形
学位