基于样本和特征结构信息的特征选择算法研究

被引量 : 3次 | 上传用户:caojinhe1118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为模式识别领域中一项关键的降维技术,特征选择已经在信息检索、文本分类、基因数据分析等领域得到了广泛的应用。近年来,利用样本集所包含的结构信息来指导特征选择,已成为特征选择研究中的一个新的热点,如Laplacian Score方法等。本文首先对基于样本结构信息的特征选择进行研究,提出了两种利用样本结构信息的迭代特征选择算法,即迭代LaplacianScore和迭代Sparsity Score。前者利用样本的局部结构信息指导特征选择,后者利用样本间的稀疏重构关系来指导特征选择。此外,本文还研究了如何利用特征之间的结构关系指导特征选择,提出了一种基于特征聚类的特征选择算法。本文的主要创新点和研究工作总结如下:(1)以保持样本的局部结构为准则,提出了基于样本局部结构的迭代Laplacian Score算法,该算法在每一步迭代过程中,评估特征保持数据局部结构的能力并丢弃最不重要的特征,然后在所选择的特征子空间中重构数据的局部结构模型,达到不断优化特征子集的目的。(2)以样本间的稀疏重构关系为准则,引入迭代特征选择的思想,提出了基于稀疏表示的迭代Sparsity Score算法,该算法以迭代方式不断优化样本间的稀疏重构关系模型,从而实现算法性能的提升。(3)利用特征之间的结构关系,将K-均值聚类算法引入特征选择中,提出了一个基于K-均值聚类的Group Lasso算法,该算法通过对特征聚类发现特征之间的结构关系,并结合GroupLasso算法实现结构化的特征选择。
其他文献
2013年,赣州市共接待旅游总人数同比增长20.7%,达到2600万人次,旅游总收入同比增长25.71%,达到207亿元人民币。其中,接待入境旅游者同比增长5.77%,达到16万人次;旅游外汇收入同比增
以典型有机氯农药氯丹为研究对象,重点研究了不同粒径土壤颗粒对氯丹的吸附特性及其对发光菌急性毒性的影响。研究结果表明,不同粒径的土壤颗粒对氯丹的吸附性能依次为:粘粒(
1994年实施的新税制,对我国税制进行了全面性、整体性、结构性的改革,把原来国家实行的32个税种,简化、调整、合并为18个税种。税法是国家法律的重要组成部分,税收政策是税收工作
本文分析了造船业面临的主要风险,并根据是否可控将风险进行分类介绍;重点讨论了新船研发风险、建造(技术)风险、原材料及船用设备供应风险及金融风险。
在叶轮机械中,引起叶片振动的因素很多。其中作用在叶片上的流体扰动力是激发振动的最重要因素。在叶片振动过程中,一般通过分析坎贝尔图来预测叶片工作时的共振状态,但是在
收纳系统是家居生活中的重要环节。首先,收纳系统具有家居空间最重要储存的功能;其次,它具备美化家居空间的作用。伴随着人们日益提高的生活水平,人们的对收纳系统要求越来越高。
汽车高速紧急避让行驶安全性一直是汽车自主开发亟待解决的关键问题,也是汽车主动安全的前提和必要条件之一。目前该领域的研究,采用的多是二自由度和三自由度的高速紧急避让汽
<正>流言:人们理所应当地认为,土鸡蛋比"洋鸡蛋"营养价值高。因此,即使价钱贵出许多,很多人还是愿意购买土鸡蛋,尤其是在给老人、孕妇和孩子吃时。那么,土鸡蛋和"洋鸡蛋"到底
动漫产业已成为我国重点扶持的领域。少儿动漫图书的出版作为我国动漫产业的重要组成部分,已迈入更为科学、系统的发展阶段。以营销管理理念为指导,从市场细分入手,将营销组
<正>由于太阳光线的照射,物体会形成一个影子,影子的朝向、长短等会随着太阳的视运动位置的不同,而时刻发生变化。面对以此作为载体,进行太阳高度、正午太阳高度、日出和日落