基于同步理论的大规模数据聚类算法分析及应用研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:xiaoniaohk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数据存储技术的飞速发展,各行各业均积累了宝贵的海量数据。那么如何高效利用“沉淀数据”辅助决策制定,进而推动经济社会发展业已成为亟需解决的问题。数据挖掘技术作为解决此类问题的有效方法,已经日臻成熟。它通过运用分类、预测、关联规则挖掘、聚类等多种分析方法获取大量数据中所隐藏的有用信息和知识。其中,聚类分析作为一种基础的数据挖掘方法,有着广阔的应用场景。在数据处理方面,它能够获取数据中所蕴含的知识模式对数据进行压缩。同时,在客户群划分、动植物种群分类、地理数据分析等众多业务领域也有广泛应用。因此,本文综合分析了国内外聚类分析方法的研究现状,并从复杂网络的角度出发,对基于同步理论的大规模数据聚类算法及其应用进行了深入研究,主要工作如下:1.结合聚类分析方法的基本工作流程,深入分析了聚类方法中常用的相似性度量指标和结果评价方法;根据聚类算法的不同思想,按照基于划分、基于层次、基于密度、基于模型的划分标准,总结了常见的聚类算法,并指出了各类算法的应用场景及相关代表性算法的具体流程;详细阐释了同步振子聚类算法的理论基础和算法的工作流程。2.研究了基于同步理论的金融网络社团检测。从股票市场入手,利用股票价格波动序列的相关性,计算股票关联矩阵。通过对股票关联矩阵的谱分析确定网络中是否存在相应的社团结构。然后,运用同步聚类算法对股票集合进行动态划分,由同步序参量确定算法收敛与否,以获取与数据集相适应的社团结构。在与快速社团检测算法进行对比实验后发现,基于同步理论的检测算法不仅能够获取正确的股票集合划分结果,且更符合股票行业分类。3.运用基于同步理论的聚类分析方法,结合视觉任务态下皮层神经元的脑电活动数据,研究了特定任务态下的脑网络功能连通性。根据脑电信号(electroencephalogram,EEG)采集实验的特点,对数据进行了相关预处理。然后,利用符号聚合近似(Symbolic Aggregation approXimation,SAX)算法度量其相似性。最后,运用同步聚类算法获取脑皮层区域的划分结果,进而通过研究皮层区域的相关性来分析功能连通性。综合Brodmann分区方案的解剖聚类结果研究发现,同步检测算法能够准确揭示“视觉选择性关注实验”所涉及的皮层功能区,以及相应的功能连通性结构。
其他文献
卡通人脸是指既具夸张风格,又不失真实人脸的可鉴别特征的艺术形象。自20世纪初开始,卡通人脸形象便大量出现在报刊杂志,深受大众欢迎。近几年来随着多媒体技术的发展和计算
将计算机网络与数据库技术相结合,建立地质网络数据库是解决地质信息管理中普遍存在的数据标准不统一、数据格式多样、数据存储分散及用户类型复杂等困难的有效途径之一。本
随着软件工程技术的发展,软件系统在后运行阶段所体现出来的动态性和自适应性显得越来越重要,成为学术界和工业界研究的热点问题之一。另一方面互联网高速发展,Web应用系统的
本文主要研究数字图像水印算法。介绍了数字图像水印的起源和概念;阐述了其特征及应用领域;在对现有自适应图像水印算法充分分析的基础上,将水印信号的处理过程分为预处理和后处
互联网已经深入到人们生活的各个方面,成为人们获取信息的主要途径之一。近些年以来,计算机技术和互联网应用的风靡带来了数据信息的爆发式增长,如何能够高效快捷低成本地从
成人高等教育是我国高等教育体系的重要组成部分,是我国全面提高国民素质,提升国民教育水平的有效举措。伴随着高等教育大众化进程的加快,成人高等教育的招生规模也在迅速的
二叉判定图这种数据结构主要用来表示逻辑表达式,而现在人们已经研制了一些表示方法:比如二叉判定树、真值表、卡诺图等等,但是对于这些表达方式而言,存储空间的需要比较大,
随着信息社会的快速的发展,流媒体技术在互联网媒体信息传播方面使用的越来越广泛。然而,随着流媒体的快速发展,流媒体文件的版权保护成为急需考虑的问题,引起各方面的重视,
与传统C/S模式相比,P2P模式致力于高效合理地组织和利用Internet 边缘上大量分布的计算、存储、通信、信息等资源,在充分利用节点资源、提高系统可扩展性等方面具有巨大的潜力
学位