基于最优化理论的数据聚类技术

来源 :中国科学院研究生院数学科学学院 中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:kuyedie222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究数据挖掘中的谱聚类算法,基于最优化理论,创造性地提出序贯矩阵压缩算法,在保证谱聚类精确度的前提下,该算法能够很好的节省运算量,将谱聚类方法真正实用化,全文共分为以下四章。   第一章:介绍聚类算法的应用背景以及相关研究现状。   第二章:介绍谱聚类算法的基础知识,这是我们所提出的序贯矩阵压缩算法存在的前提。   第三章:给出序贯矩阵压缩的谱聚类算法。将谱聚类问题抽象到最优化模型,在使用共轭梯度法和Lanczos迭代方法求解特征向量问题的基础上,将数掘元素进行聚合,这样不但保证了特征向量的准确性,而且大大节省了迭代步数。从而克服了谱聚类算法最大的弱点。我们首先从Ratio Cut和Normalize Cut两个方面入手,给出了两方面的序贯矩阵压缩算法。然后给出误差估计,这个估计说明我们的算法基本上能够保证达到共轭梯度法或者Lanczos算法的精度,但是能够大大的节省运算量。   第四章:本章主要给出数值实验来验证我们的算法。首先用模拟试验来演示我们的算法,然后在人工数据集上进行试验,最后在真实的大数据集上和其他算法进行比较。   第五章:给出本文主要研究成果,存在的问题以及下一步需要研究的课题。
其他文献
本论文运用微局部分析和黎曼几何方法主要详细研究了两个具有广泛工程应用背景的经典变系数偏微分控制系统的适定性和正则性,并由此得到,开环系统的精确能控性与比例输出反馈下
学位
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
近年来,围绕如何在市场经济条件下进一步提高决策科学化、民主化等问题,浦北县江城镇进行了积极的探索。在事关全镇经济发展全局等重大问题上,江城镇推行了换位决策制度,积极
实施新课程标准以后,阅读教学就显得极为重要与关键.实际上,阅读教学作为课堂教学的有益补充,已逐步被越来越多的人们所重视.同时,阅读教学也是对教材内容的完善和补充.在小
学生时代有幻想是让人羡慕的,那是年少青春最无法抑制的原动力。王振来自古老的齐鲁大地。任何时候,都面带无法理喻的、有些纯真、甚至有些匪夷所思的微笑是王振给人的第一印
作业布置和完成是教学和学习过程中不可或缺的一个重要环节,它不但能让学生在课后应用知识进行问题解决,也能促进学生技能的形成,对提高教学效率有着积极意义.课程标准中对数
本文从行政管理、教学课堂、实践活动、家庭教育、第二课堂等构建模式研究技校生的思想教育培养体系.
课堂是教与学的重要场所,课堂教学则是实施素质教育、提高教学质量的重要阵地,更是学生获取知识、培养能力、不断进步的渠道。因此,打造高效课堂,处理好教与学的关系显得尤为
对于任意的一棵树T和实数λ,λ≠0,λ-修改的Wiener指数定义为W(T)=∑[n(e)·n(e)]这里的n(e)和n(e)分别代表的是在树T中一条边e两边e∈E(T)的点的个数.定义T是具有n个点,P个悬挂
In order to investigate the effect of variation in the distribution of gas on explosion propagation characteristics in coal mines, experiments were carried out