基于网格密度和局部敏感哈希函数的并行化聚类算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:yongzhujushi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大数据背景下基于划分的聚类算法中存在初始中心敏感,节点间通信开销大以及集群效率低下等问题,提出了基于网格密度和局部敏感哈希函数的PBGDLSH-MR并行化聚类算法。首先,对初始数据集提出网格密度策略(GDS)获取初始中心点,有效避免了随机选取引起的初始中心敏感的问题;其次,提出基于局部敏感哈希函数的数据分区(DP-LSH)用于投射关联性较大的数据对象到同一子数据集中,得到map上的数据分区,并设计相似性度量公式(SI)对数据分区结果进行评价,从而降低了节点间的通信开销;接着设计自适应分组策略(A
其他文献
目的本研究旨在探讨血清可溶性致癌抑制因子-2(soluble suppression of tumorigenicity 2,sST2)、游离T3(free T3,FT3)、肝细胞生长因子(hepatocyte growth factor,HGF)、生
目的对比有无大血管相关病变的2型糖尿病患者的尿微量白蛋白/肌酐(urinary albumin/creatinine,A/Cr)的差异,探讨A/Cr在2型糖尿病大血管病变中的临床意义并分析相关的危险因
北非地区是中国出版走出去战略布局的重要组成板块。本文以阿尔及利亚为例,通过分析中国在北非国家的出版现状,探索在该区域开展国际合作的路径,并在此基础上运用具体数据和
一流课程建设是我国普通本科教育跨越式发展的重大举措,亟须出版技术支撑、出版资源供给、出版管理保障。当前,出版企业服务一流课程建设存在着理念滞后、参与较少、质量不佳
基于移动用户的位置服务中,通常采用位置k-匿名技术保护用户的隐私安全性。然而,用户协作构建k-匿名组中难以保证请求用户和协作用户的诚信合作行为。针对以上问题,首先基于完全信息静态博弈理论分析请求用户和诚信用户的行为策略,计算请求用户的诚信阈值,协作用户根据请求阈值与协同阈值的比较决定是否参与匿名组构建;其次,构建信誉机制将用户的近期表现与收益结合,约束参与匿名组构建的请求用户及协作用户的不诚信行为
本文旨在分析非洲英语国家的出版现状并讨论中国与其出版合作的前景。文中以尼日利亚为例提出中非英语国家开展国际出版合作的五项策略,重视合作对象国投资环境的地域性差异,
目的探讨血清D-二聚体(D dimer,D-D)、表面活性蛋白D(surfactant protein D,SP-D)及半乳糖凝集素-3(galectin-3,Gal-3)水平与支原体肺炎(mycoplasmal pneumonia,MPP)患儿病情
目的构建新型冠状病毒肺炎院内感染管理指标体系,为有效控制新型冠状病毒肺炎疫情在医院内的传播提供工具支持。方法成立院感防控的多学科团队,通过循证检索并以“结构-过程-
目的探讨3D打印脊柱后凸模型行体外模拟截骨手术在脊柱后凸畸形矫形手术中的应用价值。方法选取2019年1月至2020年5月在河南省南阳市第二人民医院行手术治疗的脊柱后凸畸形患
本文立足学术期刊在出版环境中的位置及其与环境要素的相互关系,借鉴并创新媒介生态位的分类,从时空生态位、功能生态位和资源生态位维度,分析当前学术期刊出版面临的“知识