基于类大小与样本二元约束的谱聚类方法研究与应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:jmzsren1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谱聚类算法在机器学习,模式识别和数据挖掘中是一项基础性工作。现有的研究工作表明,适当的在聚类过程中加入少量的类大小约束或者二元约束对等先验信息能够有效提升聚类效果。这里的类大小约束指的是已知某个聚类簇的个数作为先验约束;二元约束对指的是must-link和cannot-link的约束,must-link指定两个数据之间一定属于同一类,cannot-link指定两个数据之间一定不是同一类。引入约束后,算法会在适应约束的情况下对聚类结果进行提升。现有的约束谱聚类方法在聚类结果的提升上并不显著,在时间损耗上也要比未加约束的情况下逊色很多,所以有必要对约束的添加方法进行进一步优化,聚类准确率上需要进一步提高。本文主要提出了基于类大小和样本二元约束的谱聚类算法,对于这两种约束,在目标函数求解过程中是以正则项的方式添加到目标函数中,因为我们使用Normalized Cut模型为基础,因此使用特征值分解的方式进行求解。在实验过程中,我们选取了UCI数据集和人脸聚类数据集上对模型的可靠性和鲁棒性进行了验证,并将实验结果和现有的最优约束谱聚类方法进行了对比,在准确度提升和减少时间损耗上都有了很大优势。本文的主要贡献有:(1)使用径向基函数的方法构造相似度矩阵从而减少时间开销,弥补了先前方法中随机森林构造矩阵需要特征选择与剪枝的劣势。并且不用去做半正定编程同样省去了时间开销。(2)以正则项的方式将约束嵌入到目标函数中能够体现谱聚类的统一性和自适应能力,从而使结果有了较大提升。(3)尝试将类大小约束谱聚类应用到实际的人脸聚类实验中,为视频人脸识别提供了新的思路。
其他文献
关于宏观经济和股市间关系的研究最早起源于上个世纪五十年代左右,但到目前为止,国内外学者大多集中于探讨不同时空背景下宏微观经济指标和股市指标的相关性,而对于不同经济
我国高职院校已成为我国高水平技术技能型人才的重要输送基地,由于经济发展对高层次技术型人才的迫切需求不断增加,加之高等职业教育已经从规模扩张转化为高质量的发展,建设一支具有高素质的专业化“双师型”教师队伍是支撑高等职业教育高质量发展的关键力量。职业院校教师的专业素质直接影响着职业院校的办学水平和高技术技能型人才培养。因此,提升职业院校教师素质能力尤为重要。教师培训是“双师型”教师素质提升的重要途径,
软件缺陷预测方法可以在项目的开发初期,通过预先识别出所有可能含有缺陷的软件模块来优化测试资源的分配。早期的缺陷预测研究大多集中于同项目缺陷预测,但同项目缺陷预测需
本文介绍了α-氟代羰基化合物作为含氟砌块在构建手性C(sp~3)-F键的应用。发展了α-氟代烷基酯、α-氟代芳香酯、α-烯基氟乙酸酯与手性叔丁基亚磺酰亚胺发生高立体选择性的
互联网、社交网络以及交通网络组成的网络关联关系是大数据中最常见的关系。层次结构数据也是网络信息中的一种特殊情况。基于网络节点和连接的拓扑关系,直观地展示网络中潜
绩效考核是企业运营和日常管理中的一项重要工作,是确保和推进企业内部管理机制合理运行并实现企业各项业务管理目标所必需的一种管理行为。绩效考核担负着传递企业核心价值观,提高员工综合能力与企业核心竞争力的重大责任。伴随管理实践中绩效考核制度的不断实施,其局限性和不足之处日益突出。目前,从许多国内企业实行的绩效考核来说,绩效考核的作用还没有得到充分体现,很难得到期望的管理效果。尽管企业通常会消耗大量时间和
当今时代,中国以纯电动汽车为代表的新能源汽车产业与推广正在快速推进,在节能减排以及安全、效率、舒适、高性价比等多重期待和转型升级的要求下,国内外内燃机以及内燃机零
随着教育体制改革的不断深入,民众对高等教育资源的需求不断增强,这就使独立学院得以产生并迅速发展。迄今为止,全国共有独立学院300余所,在校生逾200万人。伴随着独立学院办
【目的】葡萄膜黑色素瘤是最常见的原发性眼内恶性肿瘤之一,脉络膜是其最常发生的部位,称为脉络膜黑色素瘤(Choroidal Melanoma,CM)。目前,该病治疗最常用的方法仍为眼球摘除术,但术后是否能有效提高患者的相对生存率,仍存在较大争议。因此,该肿瘤是严重影响人类健康的疾病。由于脉络膜黑色素瘤的发病机制至今尚未被完全阐明,导致临床疗效欠佳。MicroRNAs(miRNAs)是生物界存在的微小
学位