成对约束相关论文
本文改进了半监督模糊聚类中传统的成对约束(即必须链接(must-link)和无法链接(can not-link)),提出了模糊成对约束。模糊成对约束完全摒......
聚类集成是一个开放性的命题,旨在解决单个聚类算法对数据划分中数据结构多样性的限制。它通过集成多种聚类算法以获得共识聚类。......
半监督聚类是将半监督学习和聚类算法相结合,通过已有的先验信息指导聚类提高算法性能,在生物医学、图像处理、自然语言等领域广泛......
网络表示学习技术又称网络嵌入,能够得到大规模网络中各节点的低维表示向量,在保存网络结构和节点属性的同时将节点映射为低维、稠......
随着网络的迅速发展,手机等电子设备的逐渐大众化,人们时刻不停的在和外部环境交换数据,由此产生的数据资源呈现爆发式增长。海量......
半监督学习是一种应用驱动而产生的机器学习方法,已经成为人工智能和模式识别领域的研究热点之一。作为该领域的主要分支,半监督聚类......
网络流量特征选择方法是决定分类器差异性设计的关键,能够提高分类结果的可理解性,发现高维数据隐藏的结构;高效的流量分类有助于......
特征选择是机器学习领域的研究的重要内容之一。随着应用于机器学习领域的数据维数不断升高,数据存储、运算,都消耗了大量的计算机......
集成学习使用多个学习器来解决同一问题,能够显著提高学习系统的泛化能力,成为近年来机器学习领域中一个重要的研究方向。尽管集成......
作为一种重要的数据挖掘技术,聚类自发将相似的物体划分在一起,而将差别较大的物体划分开。传统的聚类算法基于无监督学习机制,仅依据......
在机器学习领域,有监督学习和无监督学习是两种常用的学习算法。有监督学习中学习器通过对大量有标签数据的学习,从而建立起用于预......
随着互联网和信息技术的快速发展,人们在日常生活和工作中需要处理越来越多的文本,怎样才能快速有效的处理大量的文本成为一个亟待......
信息化时代的今天,网络文本呈现出海量的特性,从搜索到的海量文本中提取有效信息或获取当前热点信息,需要对文本聚类,使同一个文本......
作为数据挖掘领域中的一种重要方法,聚类分析能够发现数据对象自然的分布结构。它根据数据对象之间的相似性,把数据对象分割成簇,......
随着信息技术的快速发展,各行各业都产生了大量的高维数据,如何挖掘隐藏在高维数据中的宝贵信息是现代机器学习研究的一个热点。然......
随着信息化时代的到来,各个领域的数据量呈现了指数爆炸式增长,如何高效地从海量数据中挖掘其潜在的规律性已成为智能信息处理领域......
近年来,随着多标签学习问题越来越多的出现在实际应用场景中,对多标签问题的研究已逐渐成为涉及领域内的关注热点。随着多标签领域......
随着信息技术的更新发展,人们步入了大数据时代。人们日常生活中随时随地都在产生大量的信息数据,如何在海量的信息中获得隐藏在其......
聚类分析是一种无监督学习方法,它使得同一个簇的内部对象具有高度相似性,不同簇间的对象具有低相似性。相较于有监督学习(分类)而......
数据质量对数据建模和数据分析具有直接影响,如模型的泛化能力和分析的精度等,开展数据异常检测和修复在数据质量工程、数据挖掘中......
随着信息时代人们视听消费方式的逐渐改变,电视电影等视频资源的数量快速增多,同时随着视频分析技术的不断发展以及人们对自动获取......
现有的图像聚类方法以数据全局线性分布为前提,利用先验约束估计未标记数据点的低维子空间,并将其聚类到相应簇中,因此对非线性结......
聚类分析是一种重要的无监督学习方法,它在没有类标签的参与下,通过对样本集的特征衡量其相似性,并据此将样本划分成不同的簇。目......
聚类分析作为大数据研究与应用的重要技术工具,为通讯业、银行、保险以及各大电子商务领域中的应用研究提供理论支持。其中基于划......
聚类分析是数据挖掘中的一项重要技术,已被用来探索实际应用中各种数据的潜在类结构。由于数据的复杂性,聚类结果并不一定能满足用......
半监督聚类算法是将传统聚类中加入了半监督学习思想而形成的一种新型算法,可以运用监督信息对聚类进行引导,监督信息可以分为成对......
随着计算机存储技术的发展,日常生活中产生了海量数据。对大规模数据进行分析,从中挖掘出隐藏的有价值的信息逐渐成为当今时代的热......
半监督聚类作为一种重要的半监督机器学习算法,广泛应用于图像分割、文本处理、语音识别等领域。本文将围绕半监督聚类的噪声、成......
如今聚类分析已成为数据挖掘领域的重要分析手段,根据机器学习的划分聚类分析属于无监督学习.在基于现实问题的不断发展过程中,模......
随着现代通信技术的高速发展,各种复杂多样的网络大数据出现在我们眼前,目前这些复杂网络是网络分析研究的热点之一。社区发现作为......
随着计算机技术和通信技术地不断发展,各行各业中积累的数据量正在日益增长,数据挖掘作为一种能从大规模数据中发现隐含知识的技术......
近年来,半监督学习因其卓越的性能逐渐受到模式识别和机器学习领域研究者的重视。半监督学习可利用的监督信息除了少量的标记样本......
针对基于约束得分的特征选择容易受成对约束的组成和基数影响的问题,提出了一种基于约束得分的动态集成选择算法(dynamic ensemble s......
现有一些典型的半监督聚类方法一方面难以有效地解决成对约束的违反问题,另一方面未能同时处理高维数据.通过提出一种基于成对约束......
在挖掘和分析高维数据任务中,有时只能获得有限的成对约束信息(must-link约束和cannot-link约束),由于缺乏数据类标号信息,监督维......
针对现有的聚类集成算法大都是无监督聚类集成算法且不能很好地处理高维数据的问题,设计一种基于PCA降维技术的成对约束半监督聚类......
数据集的聚类边界不清晰时,人工免疫网络聚类使用最小生成树确定聚类数的依据往往不足。分析了问题存在的原因,提出一种基于人工免疫......
针对高维数据的聚类问题,提出一种基于间隔Fisher分析(MFA)的半监督聚类算法。该算法首先使用已标记样本进行MFA映射,得到投影矩阵......
现有的自适应亲和传播聚类存在聚类时间长、精度低的缺点,提出了一种结合半监督的改进自适应亲和传播聚类(SAAP)。它首先利用半监......
针对现有的半监督降维算法没有考虑存在于数据集中的大量未标记信息,不能得到最好的降维效果的问题,提出了一种改进的基于权值的局......
经典的无监督聚类算法快速、简单且可以直接对大规模数据集进行划分,但是由于网络结构较为复杂,划分的准确度并不高。为此,提出一......
目前多标签学习已广泛应用到很多场景中。在此类学习问题中,一个样本往往可以同时拥有多个类别标签。因为类别标签可能带有的特有......
信息技术的发展催生了海量数据。聚类有助于发现数据的内在联系,从中挖掘有价值的信息。在对数据进行分析时,容易获得一些关于数据......
目前已有的成对约束模糊核聚类研究中,缺乏对成对约束信息的有效测度,进而无法充分利用成对约束这类半监督信息。在成对约束核聚类......
鉴于最佳聚类数在提高聚类算法性能并扩大其应用领域方面的重要性,为了有效解决聚类算法中最佳聚类数的确定问题,解决传统的聚类分析......
现有的半监督聚类集成方法能利用先验信息,使集成的准确性、鲁棒性和稳定性得到提高,但在集成阶段加入成对约束信息时,只考虑了给......