基于图形处理器的聚类分析算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wyhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为一种新兴的数据处理技术,近年来已成为数据挖掘中一个非常活跃的研究方向。同时随着实际应用中数据流的广泛出现,不仅需要考虑提高聚类质量,如何提升聚类处理速度也是一个亟需解决的问题。由于目前各种聚类算法均是采用CPu进行计算实现,聚类效率无法完全满足实际需要。图形处理器(graphics processing unit:以下简称GPU)具有很高的并行计算能力、超常的浮点运算速度。本文将目前几种典型聚类算法在CPU上执行的部分关键计算步骤转移到GPu上,进行非图形绘制的通用计算处理,以提高聚类速度。 与经典K-means算法相比,enhanced K-means算法只需处理部分点集的距离计算和比较操作,因而可使聚类效率得到较大提高。以此算法为基础,提出了基于此算法的CPU+GPU的协同处理模式,利用GPU多个子素处理器可以进行并行计算的特性,将算法中处理比较耗时的距离计算与比较、每次参与循环计算的点集合判断步骤由GPu实现,而初始化、中心点计算、聚类结束判定步骤仍由CPU实现,在这种协同计算模式下,可使enhanced K-means算法的聚类效率提高约35%。 其次,对经典ROCK和VBACC层次聚类算法及改进的基于动态近邻选择模型的DNNS算法进行分析比较。在此基础上,借鉴Larsen提出的利用GPU进行矩阵快速相乘的思想,将此思想和GPU多子素处理器并行处理特点结合起来,应用在DNNS算法中,即将算法中的主要运算步骤连接度矩阵计算用GPu实现,而建堆及合并操作由CPu完成,这样可使DNNs算法的聚类时间减少25%左右。 在一台配有Pentium IV 3.4G CPu和NVIDIA GeForce 6800 GT显卡的计算机上实现了上述基于GPU的算法和·完全由CPU完成的算法,实现过程中注意到CPU与GPU之间较小总线带宽,将CPU与GPU之间的数据传输最小化。实验结果表明:在具有相同聚类质量的前提下,基于GPU的聚类算法的运算速度明显快于传统的基于CPU的聚类算法的处理速度。因此,这种GPu和CPU的协同处理模式将对数据流的快速聚类实现具有一定的借鉴意义。
其他文献
近几年来,长江中下游河道采砂一直处于难于管理状态。长江中下游河道范围广,江砂被盗采的地点多,采砂监管和执法队伍人员不足,有相当数量的非法采砂事件难以发现和处理。对非
合作型多智能体决策技术研究给定的一组智能体如何协调彼此的动作,与环境进行交互,共同完成一个长远的目标。合作型多智能体决策技术有相当多的应用背景。例如,机器人足球队,球员
随着云计算、物联网和移动互联网的快速发展,大数据正成为信息技术的新热点,产业发展的新方向,对人类的生产与生活产生巨大影响。大数据来源于互联网、企业系统和物联网等信
图的连通支配问题是近几年来图论中的一个比较活跃的研究领域。图的连通支配问题的研究不仅具有很重要的理论意义,而且在优化理论、通讯网络设计与分析、网络搜索、模式识别等
随着互联网的普及,人们的工作、学习和生活与网络联系越来越紧密,在实际生活中出现了各种各样的网络。IP地址是互联网中的基础资源,但缺少有效的管理方法。传统DHCP只能实现
随着计算机技术的迅速发展,许多工作需要靠计算机按照一定的执行规则自动实现,特别是企业业务流程的自动化或半自动化实现。工作流管理系统为实现这一目标提供了新的技术手段
目前,疲劳驾驶在车辆肇事中占了相当大的一部分。疲劳往往容易引起瞌睡,但是许多疲劳的驾驶员却常常不知道自己已经处在瞌睡的危险状态之中,因此需要设计一种瞌睡监测的方法
无线传感器网络被认为是未来改变世界的十大技术之首,但有限的计算、存储和通信能力,尤其是严重受限的能量使其应用前景面临巨大挑战,无线传感器网络在应用之前需要解决很多
随着信息技术的不断发展,特别是大数据技术的发展使得对海量用户数据的处理成为可能,从数据中泄露用户隐私的问题现如今也非常严重。在校园生活中学生和教师也会产生各种各样
通信网络随着Internet的飞速发展,从传统的布线网络发展到了无线网络。作为无线网络的重要分支,无线局域网(WLAN)以它优越的灵活性和便捷性在网络应用中发挥日益重要的作用。但