基于网格和密度的并行聚类算法的研究与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:SCY512355337
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘领域中的一个重要研究课题。随着聚类分析对象数据集规模的急剧增大,改进已有的算法以获得满意的效率受到越来越多的重视。其中对现有算法的并行化是针对海量、高维数据的一种有效改进方法。 通过对国内外研究现状以及聚类和并行计算相关技术进行调研,本文着重对现有并行聚类算法进行了研究,并对其并行化改进方法进行了分析和比较。在此基础上,详细介绍了一种较好的、适合并行化改进的聚类算法——基于网格和密度的聚类算法。小波聚类是一种基于网格和密度的聚类算法,它满足一个好的聚类算法的很多要求,且求解思想优于一般意义上的基于网格和密度的聚类算法。结合小波聚类的自身特点,详细介绍了并行小波聚类算法的设计方法、设计模式以及实现步骤。 针对当前并行程序实现技术是并行计算的关键这一研究热点,特别在并行程序实现技术方面进行了有益的尝试和研究。首先学习和研究了集群环境下MPI并行编程机制;进而结合小波聚类的自身特点,主要以减少集群系统中并行处理的通信次数和通信数据量为目的,分别对问题的并行化划分方式,集群环境下节点间的通信策略,以及实现过程中数据网格的划分方式等方面进行了研究。 改进后的并行小波聚类算法及并行程序实现技术在曙光TC1700集群系统上进行了仿真试验。实验结果验证了,在MPI并行编程环境下我们对小波聚类算法的并行化改进是可行的、有效的。另外,本文的研究是建立在PC集群实验环境之上的,其理论和实践Ⅰ对日后在更大规模、更复杂的集群系统上进行应用研究也具有一定的指导意义。
其他文献
本文以鱼病图像为对象,研究了利用基于内容的图像检索技术进行图像检索的基础理论和一般方法,结合计算机图像处理技术、模式识别、机器视觉技术,建立了利用基于内容的图像检
为了解决传统网络不够灵活的局限性,研究界提出了在传统网络通信模型中增加计算结构使得网络具有可编程的思路。主动网络正是在该思路的指导下建立的,在主动网络中网络节点不但
便携式心电信号采集器是一种用于心电信号采集的小型仪器。心脏病患者可以使用它随时随地采集自己的心电信号,通过电话网传输到医疗中心,实现远程医疗,这给远离医院或行动不便的
随着计算机技术的发展和日趋完善,人们对人机交互的要求逐步提高,越来越希望能以自然的方式来与计算机沟通。因此,在新一代信息系统中,引入虚拟秘书,虚拟播音员或虚拟主持人等虚拟
最近几年,人们越来越意识到网络管理的重要性。目前,由于SNMP(SimpleNetworkManagementProtocol)协议简单易用,大多网络管理系统采用基于SNMP的集中式管理体系结构。但是,随着网
谱聚类作为极具竞争力的聚类算法,目前已经取得了较广泛的应用。谱聚类算法本质是通过特征分解,将原始的高维数据空间映射到特征向量空间,即低维的线性测度空间,然后对特征向量空
本文的选题来源于国家高技术研究发展计划资助项目“网络协同安全技术研究”(国家863计划,课题编号:2003AA142060)和西北工业大学研究生创新基金“IPv6下的入侵检测系统”(课
随着时代的发展,网络的进步,信息技术飞速地发展。与此同时,黑客、网络病毒等严重威胁信息安全的因素也越来越多。任何基于网络的信息系统的建立,其信息安全管理一直是一项至关重
在日常生活中,人们经常需要将自己的某些权力委托给可靠的代理人,让代理人代表他去行使这些权力,如签名权的委托。在电子化的信息社会,同样需要签名权的代理,数字签名是传统签名的
数字半色调技术是联系模拟原稿或物理场景数字化转换与印刷的桥梁,是数字印刷乃至现代化印刷的关键、核心技术之一。目前这项技术已经被广泛应用到了印刷、水印、信息加密技