基于Sparse Group Lasso惩罚的整合分析

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:ciha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据往往具有高维度、稀疏性、来源差异性的特点,如何合理有效地挖掘、分析此类数据集之间的关联信息和差异性,同时完成数据特征的降维去噪,是值得深思和研究的问题.整合分析不同于以往的单数据集分析和统合分析,它将多个独立数据集联合起来,同时分析多个数据集,为直接从原始数据中挖掘信息提供了手段.基于惩罚函数的整合分析将整合分析与惩罚函数变量选择思想结合起来,通过惩罚函数对系数进行压缩,从而筛选出重要特征变量,完成降维的作用.惩罚整合分析不同于单个数据集的群组惩罚,它的特点是将每个解释变量在所有数据集中的回归系数视为一组.基于二层变量选择的惩罚整合分析则不仅要筛选出显著的特征变量,还要识别出已挑选的重要变量在哪些数据集中显著,从而研究不同数据集间的关联性和差异性.本文将双层变量选择新罚Sparse Group Lasso运用到具有相似稀疏结构的整合分析中,并采用一个具有促进稀疏结构相似性作用的罚来促成这样的稀疏结构,然后创建了相应的分块坐标下降求解算法,并提出了若干模型评价指标和参数调优方法.该模型方法成功解决了在预先未知数据集结构但又有一定先验信息可知其具有相似稀疏结构的情况下整合分析的建模问题.在若干评价准则下,本文对不同模拟结果进行分析,证实了模型的可行性和不输于已有方法的优良性能,又在两个实例分析中,证实了模型方法的实用性.在模拟过程中,本文提出的基于Sparse Group Lasso罚的整合分析与已有的基于Composite MCP罚的整合分析的表现不相上下,各有优势,但在计算时间成本上,本文的模型方法更有优势.在实例分析中,两例数据集依据本文模型建模求解的结果具有相应的可解释性,有效地选出了影响不同葡萄酒品质的重要因素及五个城市PM2.5浓度的影响因素,并依此作了相应的差异性和关联性分析.
其他文献
国内外研究表明:交际意愿越强,越能促使学生在外语学习环境下自发地创造或把握课内外的语言交际机会,并实现充分的语言交流实践,进而取得语言学习的成功。可见交际意愿在中国
大脑中神经元与神经元的连接构成了复杂而又精密的神经网络。解析神经网络的结构与功能将有助于准确地理解大脑行使功能的机制及神经精神疾病的发病机理。嗜神经病毒示踪技术
肝癌是最常见的恶性肿瘤之一,具有高病发率和高死亡率的特点,现已经成为威胁人体健康与生命的一大杀手。现有肝癌治疗方式以介入手术切除为主,但是不精准的手术切除将增加疾
液晶显示屏幕(显示面板)是许多电子设备的重要部件。在显示面板封装的生产工艺中,需要将面板驱动芯片连接并固化在柔性薄膜电路板上。随着芯片尺寸的减少,对其定位与连接的精
拉紧螺杆(拉杆)是短应力线轧机保证刚度和精度的关键部件,为防止拉压应力引起的变形和微动磨损,要求其具有高强耐磨性能。原表面强化多采用离子渗氮方法,但其在高温高湿地区使用时常因腐蚀而影响轧机精度和使用寿命。本文设计采用“预氧化-离子氮碳共渗-后氧化”复合热处理工艺,使拉杆在满足高强耐磨要求的同时,改善其耐蚀性,提高使用性能。本文选用拉杆用材42CrMo钢为试验研究对象,采用正交试验分析法对预氧化、离
自1990年以来,欧盟与越南发展双边贸易,经贸关系日益加强。尤其在2001-2017年间,越南与欧盟之间的进出口贸易额从2001年的47.5亿美元扩大到2017年的504.3亿美元,增长了10.61倍。双边贸易存在较大的互补性,越南和欧盟成员国由此获得丰厚的贸易利得。为进一步促进越南与欧盟双边贸易的发展,从2012年6月至2015年12月,越南和欧盟经历了14轮谈判达成自由贸易协定EVFTA最后申
随着医疗水平的逐渐提升,我国人均寿命的延长,人们对医疗服务和健康的需求也越来越迫切。我国老龄化趋势日渐显著,老年护理服务成为当前国家医疗卫生保健领域重点开展的工作
丛式井、双水平井、连通井等复杂结构井可以大幅度提高油气井产量和最终采收率。复杂结构井在钻井过程中,需要实时精确地探测邻井距离,以确保其按预定轨迹钻进。本文在对探测
网络测试是通信设备开发和网络性能监测的关键环节之一,是专业级网络测试仪器的核心功能。流量生成器常用于为网络测试生成背景流量,搭载流量生成器的测试仪可扩展性强,应用
随着知识经济的快速发展,高等教育与政治、经济、社会联系日益密切,高等教育实力已然成为世界各国综合竞争能力的一部分。在此背景下,高校肩负的责任越来越重,为了加快迈进世