【摘 要】
:
21世纪,互联网和数据挖掘技术蓬勃发展,社会飞速进入大数据时代。持续并不断增长的海量数据改善了人们的生活方式的同时,它的储存、挖掘及应用却成为信息时代人们面临的一大
论文部分内容阅读
21世纪,互联网和数据挖掘技术蓬勃发展,社会飞速进入大数据时代。持续并不断增长的海量数据改善了人们的生活方式的同时,它的储存、挖掘及应用却成为信息时代人们面临的一大挑战。从海量的数据中高效、低成本获取潜在的知识成为学者们探求的重大问题。近年来,聚类分析技术在模式识别和数据挖掘领域被高度重视。传统的聚类方法如:k-means聚类算法、谱聚类算法等已经被成功应用到各个领域。然而,传统的基于图的聚类方法通常是基于一个给定的近邻图,聚类时需要对近邻图采用有效算法,进而获取数据的最终聚类结果。然而,数据往往存在噪声,所构建的近邻图不能满足实际应用的需要。为了解决上述问题,学者们提出了许多旨在降低误差、噪声及孤立点影响,提高构建近邻图有效性的算法。本文首先对聚类分析的相关内容进行简明阐述,其中包括研究背景、意义以及研究现状,系统的介绍了聚类算法所涉及的定义、定理等相关理论知识。针对图聚类算法中存在的问题,基于L2,1范数及图正则化思想提出了一种将构建数据相似矩阵和聚类同时进行的聚类模型:鲁棒自适应图正则化聚类算法(Robust Adaptive Graph-Regularization Clustering Algorithm,RAGR)。算法用L2,1范数取代F范数,不但能确保数据行稀疏,而且保持矩阵的旋转不变性和对噪声数据的鲁棒性。我们给出模型的优化算法,并使用matlab软件在合成数据集和真实数据集上进行实验,验证本文提出的RAGR聚类算法的有效性。
其他文献
目的:分析Twist在胰腺癌细胞株和胰腺癌组织中的表达,再通过体内外实验,观察上调和下调Twist对胰腺癌细胞新生血管形成的影响,并试图阐述Twist与VEGFA在胰腺癌中的相互关系,
目的:银杏叶提取物(Extract of Ginkgo Biloba Egb761)是从银杏树叶中提取的具有多种生物活性成分,主要含银杏黄酮苷、银杏内酯及少量白果内酯。据实验研究表明:银杏黄酮苷有提
目的观察甲状旁腺激素(1-34)(parathyroid hormone,PTH)联合维生素K2(VK2)对绝经后骨质疏松患者的临床疗效。方法选取2014年5月至2016年2月于我院治疗的120例绝经后骨质疏松患者进
针对多台虚拟同步发电机(VSG)并联运行的微电网系统易受负荷波动影响而产生的频率越限问题,提出一种基于VSG的频率二次控制策略。首先,分析VSG的控制原理,并指出一次调频的不
本文主要研究KdV型和Camassa-Holm型的非线性色散方程的初值问题.这些方程来源于水波,非线性光学,激光和等离子体物理等领域,有着重要的物理意义.本文主要目的是讨论这些方程
为确保乳酸菌活菌奶的食用安全,预防食物中毒的发生,选择深圳市日产20 t以鲜乳、糖类为主要原料,经乳酸菌发酵而制成活菌奶的生产厂家为研究对象.通过危害分析,确定原料乳及
<正>今年是中国共产党成立98周年。习近平指出,坚持和发展中国特色社会主义是当代中国发展进步的根本方向,而中国特色社会主义最本质的特征是中国共产党的领导。因此中国共产
三、国风文化的昌盛1.文学的发达日本国风文化之花首先在文学领域中开放,物语文学的迅速发展是其具体的体现,而使其成为可能性的则是「国字」(日本文字)的发明"(13).因为假名
<正>我们的生命体出生在地球上是一个奇迹,而我们对生命的认知则是不断创造"奇迹"的过程。研究生命的奥秘及起源,也成为最令人神往的科学探索之一。近日,器官的再生能力由于
[目的]为了更好的研究维生素K、维生素D及钙对骨质疏松症的治疗作用,本实验通过给予绝经期骨折病人不同剂量的维生素K4、维生素D及钙,观察服药前后血液中血清钙、血清磷、碱