基于成对差异性度量的选择性集成学习方法研究

被引量 : 0次 | 上传用户:lovefish777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习是一种机器学习范式,它通过使用多个学习器来解决同一问题可以有效地提高学习系统的泛化能力,因此它是国际机器学习界的一个研究热点。目前,集成学习技术已经在行星探测、地震波分析、文本分类、生物特征识别、遥感信息处理、计算机辅助医疗诊断等众多领域得到了应用。但是集成学习技术还不够成熟,集成学习的理论研究中还存在着大量未能解决的问题,集成学习的实际应用研究也有待进一步的拓展和深入。一般认为,有效地产生泛化能力强、差异大的个体学习器,是集成学习算法的关键。但对于如何有效地度量差异、以及更进一步如何有效地获取和利用这种差异,仍然是一个未能完全解决的问题。选择性集成方法从集成学习算法产生的个体学习器中选择一部分来集成,研究结果表明该方法可能比使用所有个体学习器来组成集成效果更好。因此选择性集成已成为集成学习的一个重要研究方向,其更好的选择策略以及算法运算速度的提高有待更多研究人员的深入研究。本文以集成学习为研究对象,介绍了集成学习的概念、理论基础、构成及两种经.典的集成学习算法(Boosting和Bagging).接着将集成学习应用到了人脸识别领域中,并与人脸识别中常用的几种学习器进行了对比实验。然后对选择性集成学习方法做了深入的研究,首先介绍了选择性集成的基本思想、理论基础,其次介绍了基于遗传算法的选择性集成算法(GASEN)和选择性集成的发展,最后在基于分类器成对差异性度量方法的基础上提出了一种新的选择性集成算法(PDMSEN)及其改进算法(PDMSEN-b)。本文的创新研究工作如下:(1)将集成学习(Boosting RBF神经网络)应用到人脸识别中,并与人脸识别中常用的几种学习器进行了对比实验。实验结果表明集成学习和SVM构建的学习器在本次实验中取得了较好的性能,更适合用于人脸识别中特征分类器,为以后在人脸识别中选择一个合适的分类器提供了参考。(2)为了提高学习器的差异性和精度,本文提出了一种基于成对差异性度量的选择性集成算法(PDMSEN).同时研究了一种改进算法(PDMSEN-b),进一步提高了算法的运算速度,且支持并行计算。最后通过使用BP神经网络作为基学习器,在UCI数据集上进行实验,并与Bagging、GASEN算法进行了比较。实验结果表明,改进算法(PDMSEN-b)在性能上与GASEN算法相近的前提下,训练速度得到了大幅的提高。
其他文献
目的观察情志护理对急性心肌梗塞(acute myocardial infarction,AMI)患者消化系统、焦虑心理和睡眠质量的改善作用.方法将80例AMI患者作为研究对象,采用随机数字表分为对照组和
《經典釋文》是陸德明給《周易》等十四種經典所作的音義,本文對《釋文》的作者、編纂旨意、内容、體例、成書年代、影響、版本作了簡要的介紹。以中華書局1983年出版的通志
"《中国国家地理》赏析"是一门中学地理校本选修课程。课程以《中国国家地理》期刊为依托,教学内容明确,与学科教学联系紧密,易于实现课程的可持续发展。选修这门课程,学生会
作为语言学理论里未定而最富争议的问题之一,预设研究深刻的影响了哲学家和语言学家考察语言的方式。自从德国逻辑学家弗雷格(Frege)1892年首次提出这一概念以来,预设就引起了
基于波浪能量主要汇集于水体表层,从破坏波浪水质点的垂直方向和水平方向的运动轨迹出发,并在前人研究的基础上,提出了桩基开孔工字板组合式防波堤结构。该防波堤结构由上部
在Windows系统中进行的程序编写是事件驱动,通过消息进行传递。因此,只有深入了解消息传递机制才能够完成Windows系统中程序编写,笔者根据自己对消息传递以及相关资料来分析
教育部新颁布的《语文课程标准》(以下简称“新课标”)把学生的写作训练提到新的高度 ,并且特别强调了要“有创意的表达”。指出教师要“为学生的自主写作提供有利条件和广阔
助动词是能用在一般动词、形容词前边表示意愿、可能、必要等的动词[1]。最早使用“助动词”这一名称的是章士钊的《中等国文典》(1907),是在《马氏文通》(1898)的基础上命名的,
近二十年,我国中药事业发展取得了较大进步,特别在产业经济方面获得巨大成功,但在目前的监管政策下,面临中药新药难于临床试验、仿制药难以对标、原有产品难以开展再评价等诸
农村金融是新农村建设和统筹城乡发展的重要支撑。然而,农村金融存在诸多现实问题。为了解决农村金融问题,学者们从农村的金融供给和金融需求进行了大量的研究,得出了许多有