基于成对约束的主动学习半监督聚类算法

来源 :应用基础与工程科学学报 | 被引量 : 0次 | 上传用户:happyyearer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能. Semi-supervised learning is an important research direction in the field of machine learning in recent years, and the quality of its supervised information has a great influence on the results of semi-supervised clustering.It is necessary to actively study high-quality supervisory information.An error-correcting proactive By studying the pairwise constraint method, the algorithm supervises the information by pairing constraints, which can not be found by the clustering algorithm itself, and introduces it into the spectral clustering algorithm. The supervised information is used to adjust the distance matrix between points in the spectral clustering. Using two-way search method, the distance between points is sorted so that the learner can learn actively even when receiving unlabeled data, which achieves better clustering results with fewer constraints. At the same time, the algorithm reduces the computational complexity and solves the singular problem of pairwise constraint in the clustering process.Experiments on the UCI benchmark dataset and the artificial dataset show that the algorithm performs better than the correlation algorithm and is superior to Spectral clustering performance using random selection of supervisory information.
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本文依据密度波理论对菱方晶系有序结构的预测结果,并考虑到α-Al2O3和α-Cr2O3 都是良好的抗高温氧化材料,选定设计有序α-(Al1-xCrx)2O3 氧化膜的结构作为研究对象。使用Mate
本文通过对荣华二采区10
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
细菌视紫红质(简称菌紫质或BR)是一种生物活性的光敏蛋白质,它具有许多优良的光学特性,其中因其优良的光致变色特性,成为目前国际上光信息处理和光存储的热点。本文对菌紫质薄膜
学位
当前,防治非典型肺炎工作是关系改革发展稳定大局、关系人民群众身体健康和生命安全、关系国家利益和我国国际形象的一件大事。我们一定要从讲政治的高度来认识和对待这个问
近些年,随着超分子化学的快速发展,分子识别已经成为生物、化学等领域的研究热点。根据识别主体和被识别客体之间相互作用时所产生的各种信号,如光、磁、电信号等,可以实现对客体的定性、定量检测,同时也可以作为研究其作用机理的有力工具。其中,基于光信号的检测方法,如紫外、荧光光谱等,由于其简单快捷、灵敏度高等方面的优势,在金属离子、生物分子等的检测方面有着重要的应用。铜作为生物体中的微量元素,在生物体的新陈
本文研究了甲基橙(MO)偶氮染料掺杂聚乙烯醇(PVA)薄膜的光致双折射性质和光致双折射特性在光开关、光存储及光调制方面的应用。利用半导体激光(473.0nm)作为激发光,He-Ne激光(632.8nm)作为探测光,研究了不同染料浓度薄膜的光致双折射,随着染料浓度的增加,薄膜样品的光致双折射反应程度明显增强。探讨了光致双折射和激发光功率、激发光偏振方向与探测光偏振方向夹角、激发次数的关系。同一样品,
民主集中制思想是在无产阶级政党自身建设的过程中逐渐产生、发展和完善的一项根本组织制度。马克思、恩格斯论述了一些党的民主原则和集中原则,可以说是民主集中制思想的萌