一种面向高维数据的均分式Lasso特征选择方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:kary_yeah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Lasso是一种基于一范式的特征选择方法。与已有的特征选择方法相比较,Lasso不仅能够准确地选择出与类标签强相关的变量,同时还具有特征选择的稳定性,因而成为人们研究的一个热点。但是,Lasso方法与其他特征选择方法一样,在高维海量或高维小样本数据集的特征选择容易出现计算开销过大或过学习问题(过拟和)。为解决此问题,提出一种改进的Lasso方法:均分式Lasso方法。均分式Lasso方法将特征集均分成K份,对每份特征子集进行特征选择,将每份所选的特征进行合并,再进行一次特征选择。实验表明,均分式Lasso方法能够很好地对高维海量或高维小样本数据集进行特征选择,是一种有效的特征选择方法。
其他文献
第21个教师节到了,我们精心编辑了一组特别的稿件:回顾从教岁月,抒发教育情怀。魏书生等七位优秀教师通过本刊亲切寄语,以切身体会诠释教师所特有的幸福和快乐。讴歌奉献,赞
目的:调查了解某部联合军事演习参演官兵的心理健康状况及心理干预效果。方法:随机整群抽取某部联合军事演习参演官兵359例,采用心理卫生自评量表(SCL-90)进行评估,并根据评
10 kV配网是电网内部的基层网络,其覆盖的地区包括城市、郊区和无人的山区,维护难度较大,经常发生故障,进而导致停电事故。简要分析了10 kV配网停电的原因,并提出了解决方案
20世纪80年代以来,国家理论在全球化的潮流中逐渐复兴。其中最重要的代表施密特在其思想被掩盖了大半个世纪之后,凭借“政治即划分敌友”的著名论断又重新回到了政治哲学的理
位于云贵高原的德宏州拥有特殊的地理位置和独特的口岸优势,是典型的跨境民族傣族和景颇族聚居地。民族文化呈现多样性,文化异质性较强。加强对跨境民族的研究有助于深化民族
<正> 程敬通(1597~1677),安徽歙县人,明末清初新安著名医家。他精研医道,擅长治疗急症重症,“一诊即能决人生死。性沉静寡言,虽当笃疾濒危,未尝动声色,投剂立起,每病者延至其
五河方言属中原官话,迄今为止,系统、专门研究尚未见,只有本县县志和安徽省方言志中零星提及。本文以三个平面语法理论和语言类型学理论为依据,结合结构主义、功能主义、认知
PPS具有机械强度高、耐高温、耐化学药品性、难燃、热稳定性好、电性能优良等优点,广泛应用于电子、机械、化工等领域。本文将PPS纤维刺成针刺毡,并对其强力、CV值、收缩率等
在联想意义理论和扩散式激活理论以及Turner(1996)的理论的基础上,提出了认知语境在多义现象中的语义阐释功能的5种运行模式:即语义投射、语义连接、语义混合、语义限定和语义转
Apriori算法是关联规则挖掘中的经典算法,针对Apriori算法的不足进行了一些改进。新算法使用垂直数据格式,并改进了产生候选项的连接方法。为了研究股票板块的联动关系,将改