组稀疏子空间的大间隔特征选择

来源 :重庆大学 | 被引量 : 0次 | 上传用户:kathy052
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术、生物技术的飞速发展,由此产生大量高维数据。特征选择作为高维数据的一种有效分析方法,受到越来越多研究者重视。所谓特征选择是指在给定的特征集中,选择一个子集,使其能很好表示原始数据。对高维数据特征选择的好坏,直接影响到后续学习算法的最终结果。因此,高维数据的特征选择也是机器学习研究的重要内容。本文以高维数据作为研究对象,针对该领域实际存在的问题,研究高维数据的特征选择方法。论文的主要内容和创新点如下:①采用局部线性方法来有效表示非线性高维数据的结构。任意复杂问题可分解成多个局部线性问题。基于此,本文通过样本的同类最近邻和不同类最近邻来局部线性近似高维非线性数据的结构。该方法非常简洁、高效且直观。②建立组稀疏子空间的大间隔特征选择模型(简称GSLM)。将样本与不同类最近邻之间的距离信息和样本与同类最近邻的距离信息投影到子空间,然后将两者相减的差值作为子空间的样本间隔,将这些间隔相加,就可得到所有样本的间隔。最大化此间隔会使投影到子空间的样本与不同类最近邻之间的距离尽量大,而与同类最近邻之间的距离尽小量。因此,最大化间隔会使投影到子空间的最近邻信息被尽量保持,从而选择有效特征。为了更合理解释由子空间所选择的特征,让所建立的模型有较强的抗干扰能力,且不破坏样本已有的概率分布。本文在目标函数中引入L2,1范数作为正则项。针对该模型的目标函数,提出一种高效的求解算法。该算法可以得到局部最优解。实验验证,该模型能选择较好的特征且相应求解算法效率很高。③提出Trace Ratio-组稀疏子空间的大间隔特征选择模型(简称TR-GSLM)。用样本与不同类最近邻的距离除以样本与同类最近邻距离之商作为间隔值。若这种间隔越大,则样本与不同类最近邻的距离应尽量大,而与同类最近邻之间的距离要尽量小。因此,最大化此间隔也可以使投影到子空间的最近邻信息被尽量保持,从而选择有效特征。针对非凸目标函数,提出一种新的迭代算法,它可获得全局最优解。同时,也给出该算法的收敛性证明。实验验证,该模型所选择的特征比GSLM要好,但其求解算法的效率较低。④提出一种增强的Trace Ratio-组稀疏子空间的大间隔特征选择模型(简称ETR-GSLM)。采用替换变量法来提高TR-GSLM求解算法的效率,由此创建目标函数,并提出相应的求解算法。虽然目标函数极其复杂且非凸,但该算法仍能得到全局最优解。由于该算法的求解过程需保持样本间隔矩阵的正定性,本文采用修改的Cholesky算法来保证此矩阵的正定性。最后证明该算法收敛。实验验证,该模型所选择的特征比前两种模型都要好,且该算法效率比TR-GSLM的要高。通过大量的实验验证本文所提出的三种算法在分类精度上比其它相近算法要好。并验证所提出算法对核函数参数、正则参数不敏感。在运行时间上,本文提出的GSLM算法具有优势。
其他文献
在经济繁荣、科技发达的今天,对教育教学也提出了更高的要求,初中学生,大多数没有过艰苦、贫困的生活经历,生活条件优越的他们往往缺乏对社会的责任感,这就需要教师在教学过
目的探讨回生口服液联合盐酸羟考酮缓释片治疗癌性疼痛的疗效。方法入组139例门诊癌痛患者,随机分为治疗组70例,对照组69例。治疗组给予回生口服液联合盐酸羟考酮缓释片治疗,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
随着新经济的到来,采购的重要性从企业经营的众环节中凸显出来。面对日趋频繁的全球采购,我国企业要更好地发展,要增强自身竞争力,就需要顺应形势,变革传统的采购管理模式,努力在全
网络控制系统(Networked Control Systems, NCSs)是将传感器、执行器和控制器等单元通过网络连接起来的分布式控制系统。网络系统因为有很多优点,如减少成本、减轻重量、降低能
控制系统性能评估与监控技术(Control Performance Assessment & Monitoring, CPA&M)是流程工业过程控制领域自上世纪80年代末新兴的一项重要技术,旨在不影响系统正常运行的
随着我国科学技术水平的不断提升,在当今时代背景下,诸多新型的信息化教学系统逐渐地出现在了人们的视野当中,并且在教育教学领域当中得到了广泛的应用.所取得的应用成效极为
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>2015年8月19日下午,食品药品监督管理总局副局长孙咸泽会见了来访的台湾民意代表廖国栋一行。双方就两岸药品审评审批以及药品监管方面的工作等内容进行了交流,孙咸泽就
急性呼吸窘迫综合征(ARDS)是由于各种原因引起的急性、进行性、吸气性呼吸困难和低氧血症,病死率极高。据资料统计,一般为50%左右。因此,尽早发现、正确诊断是提高抢救成功率的关键