一种面向数据密集型计算环境的聚类算法

来源 :济南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:rgzgjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对数据密集型计算环境下数据具有海量、分布、异构、高速变化等特点,分析传统的基于密度的分布式聚类(Density Base Distributed Clustering,DBDC)算法,借助MapReduce编程模型,提出一种新的分布式聚类算法,采用局部和全局的方式处理海量、异构数据,解决具有以上特点的数据密集型计算环境下数据的分析挖掘问题。得出算法的复杂度为O((nlog2n)/p),实验验证在数据量与节点数变化时算法具有较高的稳定性和可伸缩性,与原算法对比该算法具有较高的准确度。
其他文献
研究投加游离氯对曝气生物滤池(BAF)实现短程硝化的可行性,考察游离氯对亚硝酸盐积累的作用规律,并探讨改变加氯量和氯的投加方式对稳定维持BAF亚硝酸盐积累的影响。研究结果表明
随着经济的迅速发展以及科学技术水平的不断提高,遥感技术取得较大程度的发展,广泛应用于工程地质、水力地质以及环境地质行业中,且随着遥感技术的日益完善,其应用范围越来越广。文章针对遥感技术在水工环领域的应用进行研究与分析。
新时期建筑领域整体生产水平的提升,对现代建筑的高效施工产生了积极的影响。在此背景下,为了保持当前建筑节能外墙外保温良好的施工状况,有效应对其施工风险,则需要考虑其中
“依宪治国”是中共十八届四中全会在作出“全面推进依法治国”的决定时明确提出的一个口号,具有厚重的内涵与十分重要的意义。然而,如何在推进“依法治国”的进程中买行“依宪
对宁夏能源开发的思考汪建敏,杨小平能源资源是宁夏的突出优势。多年的投资开发,能源工业已成为宁夏重要的支柱产业。但近年来,宁夏煤炭行业几乎是全行业亏损,每年有几百万吨的落地煤不能外运而无法实现其经济效益,火力发电效益低下……原因何在?宁夏能源开发的出路...
系统思维是以系统论为思维基本模式的思维形态,系统思维方式主要以整体性、层次性、动态性、开放性等特点见长。《中共中央关于全面推进依法治国若干重大问题的决定》是运用
目的探讨轻症结直肠穿孔患者行腹腔镜病变肠段切除治疗的可行性。方法回顾性研究我院2006年6月至2016年6月间收治的61例病变肠段切除治疗的轻症结直肠穿孔患者的临床资料,对
环境污染权民事责任是侵权民事责任中非常特殊的一部分,其核心是构成要件。本文从“三要件”展开论述,探讨陈春中各要件的合理性、可行性,以使其更符合实际。
为了提高执法效率和降低人力成本,研究一种基于视频的实时高效监控方案。该方案首先利用混合高斯模型和3σ原则的背景差分法,从视频中自动检测和定位车辆,对其行为轨迹进行标记,然后利用能量等信息获得车辆的牌照信息。实验表明,该系统能够对进入监控区域车辆的轨迹进行准确标定。该方案有助于提高交通视频监控系统的安全性、实时性及可靠性。