基于Exclusive Lasso的分类和特征选择方法的研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:jzymw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于稀疏表示具有模型简单、计算速度快、对存储容量要求小、对数据的潜在联系有整体性的把握等优势,因此相关研究和应用也愈加广泛。其中,通过在稀疏约束项中使用1-范数及其组合形式来实现不同的稀疏效果是常用的稀疏表示方法之一。大多数情况下,稀疏表示是通过Lasso方法实现的,Lasso是在个体水平对不同的变量进行相同的处理来实现变量选择,这会导致过度压缩绝对值较大的参数并且会忽略数据变量的固有组结构信息。针对上述问题,Group Lasso通过实现组内非稀疏性和组间稀疏性来缓解这一问题。但是每组变量或者全部被选择或者全部被抛弃,这会导致Group Lasso选择的结果可能存在信息冗余或信息不足的问题。为了弥补这一不足,Exclusive Lasso方法被提出。Exclusive Lasso通过实现组内稀疏性和组间非稀疏性来保证每组中至少有一个变量被选择出来,从而在过滤掉冗余信息的同时获得更多有意义的信息。本文将Exclusive Lasso作为稀疏表示模型分别对样本和特征进行编码进而实现分类和特征选择任务,主要的工作内容如下:(1)本文提出了两种基于稀疏表示的k近邻分类算法(Ek NN-C和Ek NN-R)。该算法采用Exclusive Lasso实现稀疏表示模型,通过用所有训练样本表示一个查询样本得到查询样本的稀疏表示,并将线性系统得到的稀疏系数作为相似性度量来支持近邻的选择。这种相似性度量充分考虑了欧式距离忽视的重要信息,比如训练集的分布信息和类结构信息。实验表明,相比于一些近邻方法和经典的分类方法,该方法有更优越、更稳定的分类表现。(2)本文提出了一种利用Exclusive Lasso辅助的两阶段模糊粗糙特征选择算法(EL-TSFRFS)。该算法首先利用k-means聚类将特征划分成几个互不重叠的组,并使用Exclusive Lasso实现稀疏表示模型,该模型用所有的条件属性来表示一个决策属性来获得该决策属性的稀疏表示,并根据得到的系数向量选择并排序每个聚类组中的代表性特征(非零系数对应的特征);其次,通过利用基于分组的模糊粗糙特征选择来决定最终的特征子集。实验结果表明,该方法所获得的约简子集,无论是在子集的大小,还是在后续使用特征子集的分类精度方面,均优于其他模糊粗糙特征选择方法。
其他文献
自十八大以来,我国提出“海洋强国”战略,发展海洋经济,提高海洋科技水平已成为我国当前的重要任务之一。水下图像作为海洋信息的主要载体,对于开发海洋环境、利用海洋资源至关重要。但是水介质对光的吸收较为严重,加之海洋环境中浮游生物与悬浮粒子众多,这使得获取到的原始水下图像存在严重的色偏与模糊问题。水下图像中存在的问题严重阻碍了后续基于视觉任务的完成,如水下目标检测、水下设施检查、海洋生态保护等。因此,针
学位
列车可编程逻辑控制单元产品应用现场替代列车大量继电器、接触器,降低运维成本提升安全性的同时,产生了大量输入采集、输出控制、点位监测数据。提出一套针对现场多设备、多物理量、多尺度、多概率的评估方法,并分析了借助数字孪生技术构建列车控制信息模型的可行性。构建了健康管理系统控制信息模型,其中包括关系型数据库和非关系型数据库的构建。目前,LCU应用现场列车内嵌综合健康管理系统已应用于部分城轨列车可编程逻辑
期刊
本文运用文献资料法、归纳总结法等研究方法,主要从实现体教结合到体教融合模式的转变、体教结合到体教融合模式转变的要求方面对高校体育教育模式转变进行研究。
期刊
移动APP设计上存在的用户体验问题使得用户在使用中常会有各种犹豫,或者说用户的犹豫可能意味着产品设计存在缺陷。是否可以将犹豫行为作为线索来改进产品用户体验设计,是一个值得探索的课题。犹豫行为的特点是随时随地发生、行踪不定,难以采用传统的人工用户研究方法来开展研究,需要新的研究方法。本文作者试图借助一种情境感知的用户数据自动采集工具CAUX,探索如何自动识别用户犹豫行为,以及进一步开展用户体验设计的
学位
余华是一位具有强烈抒情和忧郁气质的作家,他的故事中充满了浪漫和诗意。《文城》的行文中也处处透露着余华的这一文学底色。他以对中国苦难人民的叙事为重点,以英雄的失败、艰辛、苦难、命运和宿命的伦理道德价值来表达文化意识和民族精神,体现了人性的力量美,以及作家对美好生活的寄托,即以文学艺术为引,让心灵找回精神归宿。
期刊
人体姿态估计研究的主要内容是从图像或视频中获取人体关键点的位置,当前主要应用于动作识别、安防监控和医疗辅助等领域。近十年来深度学习迅速发展,同时也带动了基于卷积神经网络的人体姿态估计算法的快速进步。在以关键点坐标为学习目标的人体姿态估计模型中,二维坐标无法为模型的训练提供强有力的监督信息,使得模型的学习难度较大;另外,模型需要通过全连接层来输出坐标值,而全连接层的权重严重依赖于训练数据的空间分布,
学位
目标检测是计算机视觉领域中的一项基础工作,其任务是对图像中存在的目标进行分类和定位。目标检测中对于小目标的检测十分具有挑战性,因为当前目标检测的主流方法仍然是使用深度卷积神经网络,基于深度卷积神经网络的目标检测算法是通过堆叠大量的卷积层提取更高层次的特征信息,来提升模型的检测效果。但由于小目标自身在图像中覆盖面积小、携带的特征信息少的缺陷,经过层层的卷积和池化后,提取到的信息越来越少甚至消失,使小
学位
报纸
随着5G通信的兴起和发展,频谱利用率与信号传输速率会得到大幅度提升,通信系统会具有更高的稳定性与抗干扰性。在得到更好的通信质量的同时,随之而来的,是新增的数十个5G通信频段,和容纳元件更多、构造更复杂的通信系统,这就对射频链路中的微波元件提出了更高的技术需求。滤波器和双工器均是无线通信收发系统中的重要元器件,分别具有频率选择特性与隔离收发信号的功能。在此背景下,本文对设计小型化、高性能的滤波器和双
学位
随着成像光谱技术的出现和不断发展,光学遥感从全色、彩色、多光谱遥感进入到高光谱遥感阶段。高光谱遥感成像可以在空间和光谱上获取丰富的“图谱合一”信息,因其在光谱上独特的“指纹”优势,高光谱在地物识别、环境监测、国防安全以及城市规划等领域都发挥着重要应用。然而,随着光谱分辨率的不断提高,高光谱图像正朝着成百甚至上千个波段发展,使得相邻波段之间具有高度的相关性,极高的光谱分辨率一方面会增加后续数据处理的
学位