基于密度的分布式聚类算法研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:doni123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当下社会信息化的发展、数据的快速积累,无监督学习算法日益受到人们的关注。而聚类算法不仅是机器学习算法的一个重要分支,更是无监督学习的重要代表,广泛应用于图像模式识别、社交网络分析、网络安全等领域。传统的聚类算法与工程实践主要是以单机形式进行,但是这种方式随着数据规模的不断增长,在数据分布、计算资源、存储空间等多方面都将受到制约。分布式聚类解决了传统聚类算法无法在分布式环境下应用的难题,同时保证了计算资源与存储空间的扩展性,使得聚类算法不再受制于数据规模、计算资源等约束。本文提出了一种基于分布式的密度聚类算法,根据原始的密度聚类算法Density Peaks设计了分布式的密度聚类算法——REMOLD,REMOLD算法以Density Peaks算法作为局部基础聚类算法,再以模型的形式将原子簇内的密度分布进行估计表示汇合至主机,在主机通过密度分布模型模拟全局密度,进行再次聚类。REMOLD继承了密度聚类的优点同时,极大的减少了中心节点的网络负载。实验结果表明,REMOLD算法在计算时间、网络传输、聚类指标等方面均可以达到较好的效果。对比三种经典的分布式密度聚类算法DBDC、Basic-DDP,LSH-DDP,REMOLD算法具有令人满意的表现,并且通过实验证实了算法的可扩展性。对高光谱图像的聚类一直是分析高光谱图像的重要方法之一。高光谱图像由于包含了大量的地物信息,对资源勘探、军事侦察、土地调查等领域具有巨大的潜在价值,引起了越来越多的关注。传统的高光谱图像聚类方法受到高光谱图像空间分辨率大小与波段维度的限制,并且不具有扩展性。本文采用分布式密度聚类的方法对高光谱图像进行密度聚类,输入原始高光谱图像,输出可视化后的聚类结果图像。实验结果表明,该方法的聚类结果具有较好的计算效率、较高的性能,能够适用于大数据场景下的高光谱图像聚类。
其他文献
随着现代铁路交通运输向着高速、重载方向发展,机车车辆普通碳钢铸钢零件已明显不能满足使用要求,正在逐步被低合金钢和轻金属所取代。铸钢材质升级后,传统的砂型铸造工艺在
为了使钨板轧制过程中的各项轧制参数得到有效控制,对钨板轧制数学模型进行了研究。首先在Gleeble热模拟机上进行热压缩试验,研究了变形抗力与各种变形条件的关系,确定了变形
目的探讨CINⅠ患者的自然转归。方法以组织病理学检查诊断为CINⅠ患者74例作为观察对象,随访12个月后行HR-HPV、TCT检查;随访24个月后行HR-HPV、TCT、电子阴道镜及组织病理学
<正>线粒体脑肌病影像表现多种多样,分类较多,临床及影像误诊较多,根据临床不同症候群可分为(1)MELAS综合征(为线粒体脑肌病、乳酸血症和卒中样发作)临床特点为母系遗传,也可
会议
智能小区的普及化发展要求智能小区面向低成本、高性能的目标设计。无论从技术方面或者经济方面考虑,采用电力线载波通信是实现小区智能化的最佳方式。论文建立了低压电力线
塑料玩具上下盖组合型腔注塑成型过程中,浇注系统的设计影响熔体流动不平衡,需要优化浇注系统。运用Moldflow软件进行浇口位置、填充及流动平衡分析可以优化浇注系统。通过模
习近平总书记指出,各级党委和政府要把支持民营企业发展作为一项重要任务。广安区纪委监委认真落实总书记要求,加强监督执纪问责,做到&#39;五个坚决维护&#39;,努力为民营经济
通过液相反应合成Al(H2PO4)3,AlCr(H2PO4)5,Al3Cr(H2PO4)123种粘结剂,对其进行了DTG、IR、XRD分析,研究了磷酸铝和磷酸铝铬粘结剂的低温固化机理。结果表明,Cr的添加一方面,能够加
教育援疆是党和国家的重要战略决策。近年来,湖北示范高职院校采取多模式对口支援新疆职业教育,促进了新疆职业教育的快速发展。为进一步强化湖北高职院校对口支持新疆职业院
随着我国体育治理体系和治理能力的改革持续推进,省级体育社团作为各省区域内的地方性体育社会组织,需要对省其地位、职能进行重新定位,以便于推进其职能定位、发展方式和管