缺失数据下极限学习机改进算法及其应用

来源 :清华大学 | 被引量 : 0次 | 上传用户:wwwwwwwwg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十一世纪以来,人类加快了对海洋资源探索的步伐,在大洋深海的中存在的大量的海洋资源,因此各个国家都在积极争取各自的海洋利益。在探索海底矿产资源的过程中,通过各种手段获得的大量数据存在缺失的情况,而处理缺失数据的矿产资源评价算法研究较为滞后。本文旨在研究能够处理带缺失数据的机器学习算法,以实现对海底矿产资源数据的利用和矿产资源的评价。极限学习机(ELM)是近年来机器学习算法中较为成功的一个,其具有速度快和泛化能力强的特点。稀疏贝叶斯ELM(SBELM)算法和TROP-ELM算法是标准ELM算法最新的两个变种,SBELM算法能够解决多分类问题,TROP-ELM能够解决回归问题。与标准ELM算法相比,以上两种ELM算法的变种不仅保留了ELM算法的优点,还能够得到更加紧凑的网络结构。然而,以上两种算法无法处理带缺失数据的数据集。为了解决这个问题,本文提出了两种基于ELM的处理缺失数据的方法,分别是:处理缺失数据的加性模型方法(Additivemodels for missing data,AM-MD)和处理缺失数据的自调节神经元状态模型(Self-adjusting neuron state models for missing data,SNSM-MD)。在UCI公开数据集上的实验结果说明了改进的SBELM算法和TROP-ELM算法与其它处理缺失数据的方法比,具有更好的泛化能力和效果。不仅如此,即使数据集中属性值缺失率达到50%,本文提出的ELM改进算法仍然具有较好的效果。最后,本文将改进的TROP-ELM算法用于带缺失数据的大洋海底钻孔数据的回归分析。
其他文献
在铸工车间生产中,按工艺守则及工艺卡片进行操作,是提高质量、全面完成生产任务的重要关键,是文明生产中最主要的特征.工艺守则具体规定了每一工段或工种所应共同遵守的操作
现有的概率字符串匹配算法通过计算字符串之间的最小失配字符数(编辑距离),可求出字符串之间的相似度。这些算法平等地看待模式串和文本串,虽然可求出二者之间完整的编辑距离,但并
<正>老年不稳定型股骨粗隆间骨折的发生可引发各种并发症,如:肺部感染、循环系统栓塞等,增加老年患者的死亡率。有相关文献报道,老年股骨粗隆间骨折的发病率占全身骨折的3%~4%
目的研究小泛素类修饰蛋白(SUMO)特异性蛋白酶3(SENP3)在创伤性脑损伤(TBI)脑组织中的分布和表达变化。方法成年雄性ICR小鼠84只,随机分为假手术组和TBI后3 h、6 h、12 h、24
随着科学技术的飞速发展.很多数字教辅资源走进课堂教学。语文教学优先使用了这一资源信息,大大丰富了教学内容,提高了学生的欣赏、感悟、实践等能力,取得了良好的教学效果。
唐宋散文,在先秦诸子散文独立文体、秦汉魏晋南北朝散文拓宽种类的基础上,更加扩展、丰富、充实了散文的内容与形式,从内容与形式的统一中,呈现出极为鲜明丰满的优雅、崇高、
二十四孝指的是中国古代社会中二十四个著名的孝子,它以宣扬封建传统伦理道德观念──孝为其宗旨,主要流行于下层普通百姓之中,在士大夫阶层也有一定影响。它内容浅俗,流传广泛,对
天津开发区净水厂三期工程采用紫外线联合氯消毒工艺,对主要工艺出水及管网水进行检测,未检出隐孢子虫、贾第鞭毛虫、冠状病毒和腺病毒;出厂水及管网水中总大肠菌群、菌落总
<正>4月15日,浙江外贸一季度"成绩单"出炉:浙江省进出口总值4774.8亿元,同比增长3%;其中,出口3742.5亿元,增长13.4%。在刚过去的2014年,浙江实现出口1.7万亿元,同比增长8.8%,
目的:研究冠心病患者A型行为因子相关分值,为调整此类患者心理健康提供依据.方法:采用随机抽样的方法,使用PSACIV行为评定量表对252名冠心病患者和102名健康者进行问卷调查,分