面向特征选择的Fisher得分算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:asdf07124029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,数据更新速度快且具有多样性。如何对数据进行有效特征提取是数据预处理中必不可少的一个环节。特征选择是数据降维的主要方式之一,其目的是为后续的学习任务选择具有最佳判别能力的最优特征子集。目前,Fisher得分是一种简单有效的过滤式特征选择方法,其主要思想是寻找使得数据类内散度最小和类间散度最大的特征子集。Fisher得分最大的特点是不依赖于学习模型,可以直接和分类算法衔接。但是,Fisher得分是从全局角度计算类内类间散度,忽略了样本的局部结构,对流形数据效果不佳。另外,Fisher得分特征选择算法不具备增强学习能力。为此,本文在Fisher得分特征选择算法的基础上展开研究,主要工作总结如下:(1)提出了基于局部Fisher得分的迭代特征选择算法。针对Fisher得分忽略了样本局部结构的问题,本文通过构造局部近邻关系图来统计数据的类内类间局部散度,提出了基于局部Fisher得分的迭代特征选择算法。通过引入迭代的思想,该算法还加强了特征之间的关联性。在每轮迭代中,算法从候选特征集中选择一个特征,该特征和当前特征子集的关联作用最大。实验结果表明本文算法获得的特征子集在后续分类任务中具有更好的分类性能。(2)提出了基于Q学习的Fisher得分特征选择算法。Fisher得分特征选择算法是没有增强学习能力的,即当有新增数据样本时,需要在全部数据上重新运行该算法。在迭代特征选择算法的基础上,本文引入了强化学习中Q学习,将之与Fisher得分结合,提出了一种新的增强特征选择算法。该算法具备了增强学习的能力,每回合以批处理的方式用少量样本进行学习,不需要一次性获得所有样本。在有新增样本时,可根据这些样本直接更新已有策略。实验结果表明,该算法可以保持稳定学习速度,在选择相同数量特征时有更好的分类效果。(3)提出了基于Q学习的Fisher得分动态特征选择算法。由于基于Q学习的Fisher得分特征选择算法不能很好地控制特征子集的大小,本文将分类性能和迭代Fisher得分绑定到一起,提出了基于Q学习的Fisher得分动态特征选择算法。该算法有两个智能体,分别管理特征选择和停止选择两个模块,可以更好地根据不同情况动态选择出最优特征子集,确定所选特征的个数。实验结果表明该算法可以为后续分类任务选择更少的特征且实现更好的分类效果。
其他文献
目的:调查青少年非自杀性自伤(Nonsuicidal Self-injury,NSSI)的特征及其影响因素,探讨NSSI、童年创伤及自尊三者之间的关系,并进一步阐明自尊在前两者之间所起的作用。方法:采用随机抽样的方式选取苏南地区的两所中学,以班级为单位进行整群抽样调查。采用自制非自杀性自伤行为评估问卷评估青少年的非自杀性自伤情况,采用童年期创伤问卷(Childhood Trauma Questio
学位
碳纳米管由于其良好的导电性和力学性能,被认为是最有可能成功代替硅的半导体材料之一。碳纳米管的特征尺度在纳米级别,需要通过纳操作机器人来实现对其的搬运操作。在碳纳米管的搬运过程中由于受扫描电镜复杂电磁场环境影响,如果只用单纳操作机器人去固定碳纳米管的一端来搬运碳纳米管,碳纳米管可能因为充电而产生变形,因此需要通过双纳操作机器人固定碳纳米管的姿态来协同搬运碳纳米管。由于纳操作机器人本身运动状态不明确,
学位
相比于传统制造方法如锻造,使用激光选区熔化(SLM)制备的同种材料一般强度更高。作为一种低碳钢,316L不锈钢相比于高碳钢等的强度较低,可以使用SLM制备316L不锈钢获得更高的强度。但SLM制造过程中复杂的热历史会引起材料的各向异性,使不同方向上性质不同。为研究其各向异性,并以使SLM制备316L不锈钢材料获得更高的强度为目的,本文使用SLM制备了 316L不锈钢并研究其显微组织与力学性能在垂直
学位
基于微透镜阵列的立体图像显示技术具有结构简单,视差连续等优点,在视觉防伪、广告印刷等方面有重要应用价值。微透镜阵列与光场图像阵列是实现立体图像的两个关键器件。在目前的研究中,立体图像显示所使用的微透镜阵列通常只有一个屈光面,导致具有运动视差的可视角度受限。在光场图像阵列生成方面,传统的通过多视点视差图像合成的方式存在计算冗余、像素映射缓慢等问题。本论文研究了具有两个屈光面的双胶合微透镜阵列设计和制
学位
后摩尔时代的集成电路特征尺寸已经进入量子效应显著的范围,传统的硅基芯片已经接近了性能极限,而碳基芯片的计算速度是硅基芯片的3-5倍,具有室温下导热性好,承载电流上限高,频响快等优点,因而碳纳米管(Carbon Nanotube,CNT)成为了有望替代硅的材料之一。以半导体型单壁碳纳米管(Single-Wall Carbon Nanotube,SWNT)为构建单元的晶圆级别碳基芯片,在自下而上和自上
学位
湿法微玻纤毡因其优异的隔声性能,在建筑隔声、航天航空等领域具有重要的应用价值。微玻纤在水中容易相互缠绕,从而出现絮聚、团聚等现象,这会影响复合毡结构的均匀性,导致复合毡性能下降,同时未添加黏结剂的微玻纤毡机械性能较差,黏结剂的大量使用存在水污染等问题。因此探索新的制备工艺,实现微玻纤毡质量均匀、结构稳定和制备出机械性能优异,声学性能优越的微玻纤复合毡是本课题的出发点。本课题通过对湿法工艺的设计,制
学位
采用氯化铵(NH4Cl)溶液浸出生活垃圾焚烧飞灰中钙后,再用碳化法对其进行回收。通过单因素实验和响应面设计获取钙离子浸出的最佳条件为:NH4Cl浓度为3.9 mol/L,反应时间为64 min,液固比为5.6 mL/g; 3个因素对Ca2+浸出的影响程度排序为液固比>NH4Cl浓度>反应时间。飞灰残渣重金属毒性浸出结果表明:Pb、Cu、Zn、Cd、Ni浸出浓度分别为0.0929,0.0012,0.
期刊
接插件是许多工业设备的基础器件,其质量优劣直接影响到工业设备的运行。接插件生产设备的温度与接插件质量关系密切,温度过高会降低接插件品质。在传统接插件的生产工序中,常采用人工测温的方式对设备进行监测,若设备温度未超出阈值范围时,再凭借个人经验调节设备运行速度以提升产量。但这种方式会耗费人力、浪费生产材料、无法准确提产。本文基于无线传感网(Wireless Sensor Networks,WSH)与无
学位
基于视频播放的景观照明是日益发展的数字城市的有机组成部分。随着通信技术、芯片技术、软件技术的不断演变,景观照明控制技术也在不断更迭之中,向着灵活配置、远程操作、云端维护等方向发展。本文基于新一代远程数据通信技术CAT.1及国产RISC-V内核短距离无线通信MCU,设计与实现了一款远程可维护及更换视频节目、可配置播放参数、边缘分布式节目存储的景观照明控制系统,主要工作如下。(1)基于通用嵌入式计算机
学位
元学习也叫学会学习,能够在已有知识的基础上快速获取新知识,适应新任务,是近年来机器学习领域的研究热点。在多数实际场景中,无标签数据比有标签数据更容易获得,因此,半监督思想被逐渐推广到元学习中。尽管现有的研究已经取得了一定的成果,但仍存在特征利用不充分、原型(类别表示)的代表性和可区分性不强以及无标签数据的利用方式不够完善的问题。本文通过自主设计的增强策略针对现有的半监督元学习算法存在的上述问题进行
学位