多视图机器学习分类及聚类算法研究

来源 :国防科技大学 | 被引量 : 3次 | 上传用户:blackfairy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实世界中数据通常有多种特征表示或者来源,这些不同的特征表示或数据来源称之为数据的视图(View)。不同的数据视图之间存在着互补信息和兼容信息,如何将这些视图信息融合起来并做出合理的决策称之为多视图学习。在机器学习中如果仅使用一种视图的信息进行学习那就会如“管中窥豹,只见一斑”一样了,只能得到片面的信息而不能做出正确的决策。相对于仅使用单个视图进行学习,多视图学习可以综合多个视图的信息,从而使得学习到的信息更为全面。目前,多视图学习已成为学术界的一个研究热点,并广泛应用于医学影像分析、自然语言处理、人脸识别等领域。本文主要研究多视图数据构造、多视图数据的融合以及多视图数据的分类和聚类算法等若干关键技术。本文的主要工作及创新点概括如下:(1)提出了一种基于极限学习机的多视图聚类方法。本文将极限学习机(Extreme Learning Machine,ELM)引入到多视图聚类任务中,提出了一种基于ELM的多视图聚类框架,并且基于该框架实现了3个算法。在该框架中,单视图归一化后的特征通过ELM随机映射被映射到高维的特征空间以获取更好的数据特征表示。之后,我们在此特征空间进行无监督的多视图聚类。据我们所知,该工作是首次将极限学习机应用于多视图聚类。大量实验表明,我们提出的算法相对于近几年文献中提出的多视图聚类方法有明显的性能提升。(2)提出了一种基于视图构建的局部核对齐的多视图聚类方法。为解决数据表示单一的问题,本文提出使用极限学习机构造数据的多视图特征表示,并挖掘数据的多个视图之间的局部核对齐性质,提出了一种多视图聚类方法。在该方法中使用极限学习机的随机特征映射构造视图,不同的视图对应不同的隐含层节点。然后,通过实验分析了这些视图之间的互补性和兼容性,在此基础上提出了一种基于局部核对齐的多视图聚类方法。该方法具有良好的通用性和可扩展性,并可以将多视图算法应用于单视图数据学习中,实验结果表明本文提出的算法相较于对比算法能有效的提升聚类的效果。(3)提出了一种lq范数的样本自适应多核学习算法。现有样本自适应算法(Sample-Adaptive Multiple Kernel Learning,SAMKL)的形式是l1范数,该形式并不灵活。此外,SAMKL算法都是基于预先计算好的基核开展的研究。为了使得基核的组合更为鲁棒并在实际应用中更为通用,我们将SAMKL的形式扩展为任意范数,并应用于图像分类任务中。在本文中,我们根据group-lasso和MKL之间的等价性提出了一个封闭形式的解决方案来优化基核权重,并提出了一个高效的lq范数(q≥1并表示基核权重的lq范数)的样本自适应多核学习算法。然后,使用优化方法(如割平面方法、交替坐标下降方法)来求解最大间隔优化问题。除此之外,我们还提出了一个求解图像分类问题的多核学习算法(Multiple Kernel Learning,MKL)的框架。与现有的多核学习算法相比,本文提出的算法在多个数据集上展示出了更好的分类性能。(4)提出了一种基于特征融合的深度聚类方法。图像聚类是机器学习中具有挑战性的任务之一,并已广泛用于各种应用。最近,学术界已经提出了各种深度聚类方法。这些方法一般是采用一种两阶段的学习方法,顺序的或者联合的使用特征学习和聚类。我们观察到这些工作的重心通常集中在输入重构损失和聚类损失的组合方式上,少有工作研究进一步的提升神经网络聚类中的特征表示能力。在本文中我们提出了一种采用类Inception模块的深度卷积嵌入式聚类算法(Deep Convolutional Embedded Clustering with Inception-like block,DCECI)。具体而言,在对称深度卷积网络中引入具有不同类型卷积滤波器的类Inception模块以保留卷积层的局部结构并对不同的非线性特征进行融合。在该方法中我们同时最小化卷积自动编码器的输入重构误差和聚类损失。与其它对比算法相比,我们提出的方法在多个图像数据集上取得了较优的实验结果,验证了本方法的有效性。
其他文献
为了简化发酵工艺、缩短发酵时间、提高发酵效率,采用聚乙烯醇凝胶作为包埋剂进行酵母固定形成固定化酵母产品,并将其直接发酵甜菜汁进行燃料乙醇生产技术研究,结果表明,固定化后
口腔黏膜溃疡是口腔科临床的常见病、多发病,月经周期、创伤、生活无规律、心理创伤等都可成为口腔溃疡的诱因。虽然口腔溃疡创伤不大,但是往往疼痛难忍,愈合迁延。笔者临床上采
目的:探讨生化汤治疗不全流产的临床疗效及作用机理。方法:396例不全流产患者随机分为治疗组和对照组各198例,治疗组生化汤治疗7天,对照组抗生素及催产素治疗7天,观察两组治疗
目的探讨应用奥美拉唑加血凝酶治疗慢性呼吸衰竭并发上消化道出血的临床疗效。方法将60例患者随机分为观察组和对照组各30例,观察组应用奥美拉唑加血凝酶治疗,对照组使用西咪替
在道路桥梁工程项目的施工建设过程中,施工建设技术型人才对工程施工建设的安全质量有着重要的决定作用和意义。随着道路交通事业的不断发展,道路桥梁工程建设中对于技术专业
近几年,随着沼气技术的日趋成熟,以沼气为纽带的生态家园富民计划在广大农村的实施,沼气技术已经在农村大面积得以推广和应用,农村沼气建设进入了一个新的发展时期,沼气、沼液和沼
通过对影视剧中的40位和现实生活中的45位继母形象进行统计和分析,并运用量化分析外在形象、态度框架、心理行为三个框架,进行了13个方面的编码统计,验证研究假设,结果发现继
诗是中国文学承传的主流艺术形式。一部中国文学史,可以说主要是诗的历史。从“诗三百”、楚辞、汉魏乐府、唐诗、宋词到“五四”新诗,再到新时期诗歌,中国诗歌造就了中国文化的
EVA与内部审计在公司治理为企业增值目标上的一致性使得二者的结合成为可能。文章以EVA的视角研究企业增值型内部审计,对EVA以及增值型企业内部审计的国内研究现状分别进行综
文章尝试从海绵城市的体系建设出发,构建五级风险管理为基础的城市洪涝体系,以打通城市水脉,构建主干河网,建设各级有效海绵体,雨水利用策略,监测及预报系统,灾后应急机制及规划实施