监督信息在图学习中的有效利用

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:js_netbit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于图的学习方法近年来受到越来越多研究者的关注,它不仅有着深厚的图论理论作基础,而且还指明了数据间的联系与数据本身同样重要这一提高现有学习算法性能的关键。监督信息对于机器学习中的有监督学习和半监督学习,既是重要的信息来源,又是最终的学习目的。本文将对应到图上的监督信息划分为两类——点约束和边约束,并把机器学习中的有监督分类和半监督聚类分别视为具有点约束的学习问题和具有边约束的学习问题,重点从图的角度讨论这两类学习算法对监督信息的利用方式。传统的有监督分类算法用基于属性的方法估计从数据到类别的映射函数,只利用了顶点上的信息。虽然核方法引入了数据间的两两关系,但也只利用了数据的条件属性,没有把顶点上的监督信息扩展到边上加以利用。类似地,大多半监督聚类算法用点对约束限制可行解的搜索范围或者学习一个合适的度规,从而使聚类结果尽可能满足事先给定的约束条件,但却鲜少考虑把边上的监督信息的扩展到顶点上加以利用。本文提出将已知的监督信息在图的点边结构上进行传递,从而提高有监督分类和半监督聚类算法对监督信息的有效利用。首先,我们提出了一种统一的非线性分类框架,称为流形映射机,它由监督式流形映射,分类器构建和测试数据扩展三部分构成。该分类框架将顶点间的类别关系融入到边的权重上(点—边),然后有监督地将不同类别的数据在新的低维特征空间中分离开来(边—点),有利于后续分类器的构建,是一种“点—边—点”的途径。为了使测试数据映射到目标空间后能达到类似的效果,我们在数据的原始流形和目标流形之间搭建了一个“桥”,通过最小化测试数据从原始流形和目标流形映射到该中间“桥”上的差异,确定测试数据在目标流形上的最佳映射。此外,我们还讨论了流形映射机与几种著名流形学习算法之间的联系,证明了该框架可行性和广泛性。其次,在流形映射机框架的前提下,我们提出了一种监督式谱空间分类器。该分类器用线性融入监督信息的方式,将输入数据映射到低维的监督式谱空间中。然后,S3C分别采用了三种不同的分类算法用于分类器构建。在测试数据扩展阶段,我们证明了S3C通过构建流形桥所推得的测试数据最佳映射与Nystr m方法具有相同的形式。大量基于人工数据集和真实数据集的实验结果显示,S3C的分类性能显著优于其它多种经典的分类算法。最后,我们提出了一种局部约束传播的半监督聚类算法,可用于处理既有必连约束又有不连约束的多类别半监督聚类问题。该算法先确定每个约束顶点的影响范围(边—点),然后根据每个无约束边所连接的顶点与有约束顶点之间的相似度,将约束边的影响成比例地传播开去(点—边),因而是一种“边—点—边”的途径。我们将每个顶点的传播范围及其影响程度定义为介于细粒度顶点和粗粒度簇之间的一种中间结构,称之为“组件”。通过评估各个组件传播范围的准确程度,算法还可以自适应地调节各个点对约束在不同组件上的传播强度,使得置信度高的组件受到的约束影响较大,而置信度低的组件则受到的约束影响较小。大量基于UCI数据库,文本文档,手写数字,英文字符,人脸识别和图像分割数据集上的实验证明,局部约束传播半监督聚类算法比其它经典的半监督聚类算法更准确,也更高效。
其他文献
以宁夏司法警官职业学院图书馆为例,从图书馆的利用满意度、馆藏满意度、服务满意度等方面进行了问卷调查,并对统计结果进行了分析,提出了促进图书馆发展的具体措施。
教育资源是幼儿科学教育的重要因素,其中教师与幼儿是最重要的人的要素,幼儿园、家庭和社区是最重要的物的要素。科学教育主要在人与物的相互作用中得以开展。幼儿教师起到关
本文设计制备了一种兼具强度及导电性的Fe-Cu复合材料,Cu在整个材料中起到粘结相的作用,并形成导电网络提高导电性。Fe基组织为强化相。通过复合协同效应,制备出兼具Cu的优良
东盟是福建传统的经贸合作伙伴,近年福建与东盟贸易呈现出双边贸易规模大、增长快,贸易依存度高,在福建外贸中的比重快速提高等特点。从模型实证分析看,福建与东盟的传统贸易
论述了等离子煤粉点火的工作原理,介绍了王坪电厂循环流化床锅炉概况,分析了将燃油燃烧器点火改为等离子点火的可行性,探讨了循环流化床锅炉点火方式的优化。
在提取的RGB图像的R分量图像上提取二值图像和边界图像,计算马铃薯图像的偏心度、矩形度、圆形度以及边界图像的10个傅立叶描述子等共计13个形状特征。其次把样本的形状特征
为了把服务准确送达游客手机,提出了一种基于Android平台的智能导游系统解决方案.首先介绍了系统总体架构,主要包括了导游云服务中心、导游传感器网络、导游手机三层,阐述了
语文课堂评价的价值取向:要以学生的发展为中心进行主体取向,要体现学科特点进行言语能力取向,要体现语文教学的终极目标而进行文化取向。主体取向、言语能力取向、文化取向
为讨论初始状态对演化稳定性的影响.利用量子博弈相关理论,以囚徒困境模型为例,应用Luca Marinatto和Tullio Weber的量子化方案进行量子化,求出不同初始状态下的囚徒困境纳什
<正>从湖北省武汉市公安局获悉,武汉警方近日破获一起特大网络诈骗案,共抓获包括卢某、熊某等8名主要成员在内的涉案人员808名。2017年4月,武汉市公安局江岸分局民警在工作中