基于迁移学习的特征选择与分类方法及其应用研究

来源 :江南大学 | 被引量 : 4次 | 上传用户:liongliong428
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,特征降维和模式分类方法作为模式识别研究领域的两大重要内容,受到广大学者的关注。特别是随着近期出现迁移学习框架的快速发展,使特征降维和模式分类方法的适用范围更加广泛。但是,传统的特征降维和模式分类方法仍然面临着一系列的问题,如精度不高,泛化能力弱,应用范围单一等。鉴于此,本课题在迁移框架下对特征降维和模式分类进行了相关研究,具体内容如下:1、以Relief算法为基础研究了基于迁移学习的特征选择方法。在迁移学习的应用场景下构造了基于间距最大化原理的最优化学习问题,而后运用优化理论对该函数进行了理论证明,最后对应于迁移环境下二类和多类的迁移学习问题,提出不同版本的迁移Relief算法。通过在人工集和真实数据集上的实验表明算法是有效的。2、研究面向演进数据流数据的分类方法,在有效利用相邻演进窗内数据间相似性信息的基础上,通过引入反例信息,构建了一种面向演进数据流的增强型演进分类器优化目标函数,从而推导出面向演进数据流的分类新方法。该方法在保有最大间隔原则和全局优化特性的同时,亦充分考虑反例信息对待解分类平面的影响。模拟和真实数据集上的实验表明了所提新方法的有效性。3、基于组概率的学习方法因其能够很好地保护数据的隐私性而成为近年来机器学习领域的研究热点。已有的组概率学习方法虽然取得了一定的效果,但是在模型训练时仅考虑单一的场景信息,如果在当前领域所采集的数据信息有限,则在当前领域下建立的分类模型泛化能力较差。针对此问题,提出了一种基于组概率和结构风险最小化模型的迁移组概率学习机(TGPLM)。该方法通过构造领域相似距离项来引入历史领域的先验知识,提出了针对类标签保护数据的增强型分类器优化目标学习准则,以期在有效利用当前领域数据类标签组概率信息的同时借鉴历史领域相关知识来指导当前领域下的学习任务。基于模拟、UCI及PIE人脸等数据集上的实验结果表明,本文所提之方法是有效的。4、为解决机器学习中的主观知识缺失问题,提出一种新的面向共享数据的迁移组概率学习机(TGPLM-CD)。该方法方法基于结构风险最小化模型,将源领域所含知识和目标领域的类标签组概率信息,特别是领域间的共享数据纳入学习框架中,进而实现了源领域和目标领域的知识迁移,因此在待研究领域数据信息不足的情况下提高了分类精确度。在大量数据集上的实验结果上表明了所提方法的有效性。5、在真实世界中往往无法得到数据的确切类别标签,为解决该场景下的分类学习问题,提出一种新的适用于不确定类标签数据的迁移标支持向量机方法(TSVM-UL)。该方法基于结构风险最小化模型,同时将源领域中所学知识,领域间的共享数据及目标领域中已标定的和不确定的数据纳入组概率学习框架中,进而实现了源领域和目标领域的知识迁移。在PIE人脸数据集和20Newsgroups数据集上的实验结果上表明了所提方法的有效性。6、在政治、欺诈检测和疾病诊断等领域,为了保护数据标签信息的隐私性,一种常见情况是仅知道少量已标记信息和未标记样本的比例信息,由此产生了一种人为的信息缺失。为解决该应用场景下的分类学习问题,提出一种新的部分类标签隐私保护的流形支持向量机(Support vector machine with manifold regularization and partially labeling privacy protection,SVM-MR&PLPP)。该方法将未标定数据的类标签比例信息纳入流形正则学习框架中,构造了一种分类器优化目标函数准则,提高了分类学习能力。而后为降低算法复杂度优化了目标函数,提出了适合大样本数据集的部分类标签隐私保护的大样本流形支持向量机(Scalable support vector machine with manifold regularization and partially labeling privacy protection,SSVM-MR&PLPP)实现了对大样本的快速训练和分类。大量人造和真实数据集上的实验结果表明了SVM-MR&PLPP和SSVM-MR&PLPP算法的有效性。
其他文献
讲珠算历史,我不愿意拉得太长。固然,旧石器时代的人们,为了生存和发展,不能没有"算",但那是最低级的,没有成型的算具和算法。研究这些,没有多大意义。
节奏,作为构成音乐的第一要素,在音乐作品中发挥着关键作用。节奏直接反映了乐曲的音乐情绪。在音乐演奏过程中,不同的情绪需要不同的节奏进行艺术表现。演奏者对音乐作品的
一、活动目标(一)复习直加直减、满五加破五减珠算,尝试多笔珠心算。(二)培养幼儿的合作与竞争意识,体验珠心算的魅力。二、活动准备(一)直加直减、满五加破五减的混合题卡若
期刊
近年来,随着计算机性能的不断提高和彩色成像设备的不断改进,彩色图像处理算法得到了越来越多的关注。然而,由于彩色图像的三个颜色通道之间存在着强烈的光谱联系,彩色图像处理算
目的从牛蒡子药材中提取、分离、纯化牛蒡子苷。方法采用正交试验方法优化牛蒡子苷的醇提工艺;使用大孔吸附树脂柱粗分离,经硅胶H层析柱精制,得到牛蒡子苷纯品。结果牛蒡子苷
为有效推广珠心算教育,提高珠心算开发儿童智力的教学水平,中国珠算心算协会于2010年1月20日至26日,在北京举办首期初级珠心算教师培训班。
本文结合工程实例,对钢筋混凝土水池裂缝的成因、危害和防治措施进行深入的分析,对工程中清水池出现的裂缝原因进行具体分析并提出相应的处理措施,确保另外两个清水池施工后
通过"点对点"测基层弯沉和厚度、底基层弯沉和厚度及路基模量的方法,建立了半刚性基层各类损坏和模量的关系。根据此关系,结合路面结构层承载力的要求,采用乳化沥青再生技术,
基于计算机视觉的驾驶员辅助系统(Vision-Based Driver Assistance System,VB-DAS)采用相机作为主要的传感手段,以实现车辆的安全行驶为最终目标。根据研究对象的不同,DAS主要
对钢包无碳衬预制件浇注料的性能进行了研究,主要研究了Al2O3微粉、SiO2微粉、金属铝粉、有机纤维等结合剂及外加剂对钢包无碳预制件浇注料性能的影响。研究发现采用Al2O3微