面向高维多场景的无监督特征选择方法研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:rmprinthecb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无监督特征选择作为一种重要的数据预处理技术,其在不借助任何数据标签信息的情况下,能够从原始特征空间中选择出最具有价值和判别性的特征。无监督特征选择不仅能降低数据的维度,有利于数据的可视化和理解;同时由此产生的模型通常也具有更好的泛化能力。本文主要对不同数据来源场景下(单视图和多视图两个场景)的无监督特征选择问题进行研究,主要的研究工作和研究成果总结如下:(1)针对单视图场景,本文提出了基于自适应图学习的广义不相关回归模型用于无监督特征选择。该模型能够同时选择具有判别性而且不相关的特征。此外,模型在约减后的子空间中自适应地学习相似度矩阵,能够减轻原始数据中噪声和异常值的负面影响,显著提升特征选择的性能。进一步地,本文开发了有效的迭代优化算法来求解目标函数,并从理论和实验两方面分析了算法的收敛性和时间复杂度。最后,在多个真实数据集上的大量实验表明,本文所提出的方法优于目前先进的基线模型。(2)针对多视图场景,本文提出了基于一致性和互补性学习的不完备多视图无监督特征选择模型。所提出的模型将特征选择整合进基于加权非负矩阵分解的聚类框架中,同时利用视图间的互补信息来学习可靠的相似度结构,并学习一个共同的聚类指示矩阵来融合不同视图间的一致性信息。与之前方法基于视图完备的假设不同,该方法能够解决多视图不完备场景下的无监督特征选择问题。同时,本文开发了有效的迭代优化算法来优化目标函数,并在理论和实验两方面分别分析了算法的收敛性和时间复杂度。最后,实验结果表明,所提出的模型在多个基准数据集上的性能优于最先进的基线模型。
其他文献
近年来,节能环保已经引起了各界的普遍重视,如何实现经济环境两手抓是整个中国经济社会发展中必须要考虑的问题。随着国内金融业的发展以及政府对环境的监管力度不断提高,科学技术创新效率也在日益提升。同时由于国内各地区之间发展的不平衡性,本文将从空间效应的角度,来探究环境规制以及绿色金融的发展对绿色技术创新会产生什么样的影响。数据选用中国除西藏、港澳台地区的30个省级区域2010年至2019年的数据;分别用
学位
《中华人民共和国国民经济和社会发展第十四个五年计划和2035年远景目标纲要》(以下简称“十四五”规划纲要)明确提出,未来这段时间内社会经济的发展,必须以推动高质量发展为主题,以深化供给侧结构性改革为主线,以改革创新为根本动力,加快构建新发展格局。新发展格局明确提出提升消费水平和消费质量的要求,扩大内需的同时还要促进消费向绿色、健康、安全发展。促进消费是新发展格局下实现国内国际双循环的重要举措,提升
学位
<正>核心提示本文分析了存量规划背景下城镇低效用地盘活利用面临的挑战,总结了以强化规划引领、厘清产权主体、创新收益分配机制、促进用地功能转型为逻辑主线的低效用地盘活路径,并提出了全流程产权整理、设立整理委员会制度、建立专项开发基金等政策建议。
期刊
目的 评价乌梅粉和水煎剂对消化性溃疡的疗效。方法 采用2,4,6-三硝基苯磺酸(2,4,6-trinitrobenzenesulfonic acid,TNBS)诱导的克罗恩病大鼠模型,比较乌梅粉和水煎剂的抗炎活性;分别采用超高效液相色谱-电喷雾电离四级杆飞行时间质谱联用(ultra-high performance liquid chromatography coupled with electr
期刊
对像卢曼这样的世界性思想家的研究和探讨不应大而化之,也不应仅停留在先入为主的意识形态批判层面,而是应该结合中国本土问题意识,以学术共同体集体合作的形式系统地展开精密研究,进入学说继受的新阶段,推动和滋养中国本土问题和研究的进步。卢曼的思想发展轨迹大致分为三个阶段。《法社会学》是卢曼思想第一阶段的典型代表。自第二个阶段开始,卢曼的思想走向转折与过渡,并在第三个阶段完成转向。但是,第二、三阶段的转向发
期刊
在过去的两年里,"5G+工业互联网"应用场景发展迅速,企业数字化、智能化转型步伐加快,运营商的业务也越来越向互联网化、个性化方向发展。中国移动作为宽带和互联网流量主要提供商之一,在业务运营中积累了大量的用户信息,数据覆盖了用户生活的方方面面。这些庞大、稳定且快速增长的数据,为移动运营商进行用户数据分析创造了良好条件。对于运营商而言,如何准确快速地找到5G潜在客户,推荐相关业务,使未来5G用户量快速
学位
常设机构原则作为收入来源国确定对跨国企业营业所得的征税依据,多年来,一直作为税收管辖权的划分基础来维护着各国的税收权益。但是伴随着数字经济的迅猛发展,新的商业模式逐渐脱离出传统常设机构的联结度规则范围,物理存在已经不足以衡量是否具有联结因素。交易的虚拟性、数据的依赖性、资产的流动性以及用户创造价值这些数字经济最显著的特点,给当前的国际税收规则带来十分猛烈的冲击。一方面,传统常设机构认定规则失灵,导
学位
共享经济的时代背景下,除了出现滴滴等实体共享经济模式,将知识作为商品进行交易的新型共享经济模式也成为了热点。以知识共享为基础的不同类型知识付费平台呈现井喷式的增长,并于2016年达到顶峰。然而学界关于知识付费平台的研究较少,且以线上模式为主,研究角度也多为知识消费者与平台。在行平台作为O2O类知识共享平台(即线上交流、线下约见)模式的典型代表,在产品运营、目标用户、产品特征等方面与分答、喜马拉雅F
学位
推进基本公共服务均等化是站在新的历史起点,身处新的历史发展阶段,促进社会公平正义、保障民生、增进福祉、应对社会主要矛盾转化的一项重要政策实践,更是不断奋进以实现第二个百年奋斗目标和实现共同富裕最终目标的必然内容和必须手段。本文以概念与理论分析为逻辑起点,以实证分析为基本方法对我国基本公共服务供给水平与财政支出效率展开研究。首先,构建一个内容准确且能复合评价的指标体系,以2010年到2019年省级地
学位
当前我国踏进了新时期,经济发展需要从以前的经济高速增长逐步转变到高水平、高质量的发展。与此同时,新的生产要素伴随社会主义市场经济的持续发展逐渐大规模涌现,其中最具有代表性的数字经济。数字经济在中国国民经济中所占有的份量在逐步增加,并逐步成为驱动中国社会经济发展与转型的巨大新生动能。但数字经济将怎样促进中国国民经济高质量发展仍需要进一步深入探讨。基于此,论文把数字经济与经济高质量发展水平看作是关键的
学位