基于极限学习机的集成特征选择算法研究与应用

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:lipeng632
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习技术在生物医学等领域得到广泛应用与关注,特别是基于机器学习的癌症患者分类诊断、各种疑难疾病患者的分类诊断成为人工智能领域学者关注的热点。高通量测序技术使得高维的癌症基因表达数据极易获得。但这类数据的样本量通常较少,从而成为高维小样本数据。分析该类数据的关键和首要步骤就是特征选择,剔除不相关的、冗余的基因,保留癌症致病基因,提高癌症患者的诊断准确率。疑难疾病诊断中,患者经常伴有各种不相关的并发症状,这些并发症状会影响医生对病人的诊断结果,正确诊断是挽救病人生命的关键。特征选择技术可以有效发现患者的关键致病因素,帮助医生做出正确判断。极限学习机(Extreme Learning Machine,ELM)是一类基于前馈神经网络的机器学习算法,其主要特点是输入权重和阈值可随机给定且无需调整,学习过程仅需通过计算输出权重来实现。ELM具有学习效率高且泛化能力强的优点,被广泛应用于分类、回归、聚类等问题中。因此,本文将ELM引入特征选择过程,对特征子集进行评估,提高特征选择过程的效率。本文主要工作和创新点如下:(1)提出了基于同质极限学习机分类器集成的特征选择算法EEGFS(Ensemble ELM and G-score based Feature Selection):在 Filter 过程中,采用 G-score对特征进行排序;在Wrapper过程中,采用扩展的顺序前向浮动搜索(Sequential Forward Floating Selection,SFFS)策略搜索特征子集,通过引入极限学习机参与Wrapper过程,提高特征选择效率;充分利用极限学习机参与wrapper过程产生的多个特征子集,在这些特征子集上构造模型得到不同的基分类器,并将基分类器进行集成以得到最终的分类结果。(2)提出了基于K-ELM的特征子集集成特征选择算法:针对特征子集不稳定问题,本文基于样本采样技术采集到不同训练子样本,在这些子样本上分别进行特征选择,产生不同特征子集,通过特征子集集成策略得到集成后的特征子集。基因数据集上的实验结果表明,本文算法在一定程度上提高了特征子集的稳定性并且对于数据变化具有较强的鲁棒性,同时也保证了特征子集的区分能力。(3)提出了基于ELM、K-ELM、EM-ELM异质ELM分类器的集成特征选择算法,并应用于红斑鳞状皮肤病诊断:分别将ELM、EM-ELM、K-ELM引入特征选择过程以评估特征子集,采用扩展的顺序前向搜索SFS(Sequential Forward Selection)策略搜索特征,提出三种特征选择算法;通过改变三种学习算法的参数探究其对特征选择结果的影响;将三种特征选择算法所选特征子集对应的分类器进行集成,提高红斑鳞状皮肤病的诊断准确率。
其他文献
苯并菲啶类生物碱(benzo[c]phenanthridine alkaloids)是一种重要的异喹啉生物碱,广泛存在于罂粟科和芸香科植物中,大多具有抗肿瘤、抗病毒、抗炎及抗菌等广泛生物活性.本论
可加或线性交换映射与斜交换映射是算子理论与算子代数中重要的映射之一,他们的结构性质已被许多学者进行了研究.本文主要研究算子代数上的非线性交换映射、斜交换映射以及相
腐败普遍存在于全球的各行各业,特别是国家进入快速发展阶段,由于制度体系不够健全产生了滋生腐败的温床,对宏观经济产生了一定危害。随着我国改革开放后经济的迅速发展,腐败
随着社会发展的步伐不断加快,导致人们时常处于工作强度高和竞争激烈的环境下,使得人们不关心自己的睡眠问题,并且大多数患有睡眠问题的人没有得到及时的诊断与治疗。尤其是,
目的:探讨静脉结合皮下注射葡萄糖酸钙治疗氢氟酸烧伤的疗效及安全性。方法:2006年1月至2013年8月收治的81例HF烧伤患者,烧伤面积(包括Ⅰ度):≤1%TBSA15例,1~5%TBSA52例,6~10
水曲柳(Fraxinus mandshurica)具有较高的经济价值,是我国Ⅱ级重点保护野生植物。多年来,国内外关于水曲柳生理特性、杂交育种、碳氮代谢、组织培养等方面已有大量报道,但基
大规模MIMO(Massive Multiple Input Multiple Output)技术是目前5G通信系统研究的关键技术之一,通过配置大量天线,在不增加系统带宽的前提下能够极大地提升系统容量。大规模MIMO系统在天线数激增时产生的导频污染严重影响信道状态信息(Channel State Information,CSI)的准确获取,导致系统容量受到限制。本文主要研究如何采取有效措施来减小导
大宁-吉县区块太原组-山西组砂岩储层共发育三种类型成岩相:(1)岩屑砂岩-粒内孔-晶间孔-泥质胶结相;(2)岩屑石英砂岩-粒间孔-粒内孔-硅质-泥质胶结相;(3)石英砂岩-粒间孔-晶
随着当前经济的发展、社会的进步,日益严重的生态问题越来越制约着人类社会的发展,给人们的生产、生活带来了巨大的挑战。党的十九大报告中明确提出:“我们要建设的现代化是
国民经济和社会发展规划、城市总体规划、土地利用规划,这三项规划都是指导城市发展的重要蓝图和依据,由不同的政府职能部门牵头编制,但在具体空间规划实践中,由于不同主管部