一种YARN和Spark框架的网格聚类方法

来源 :现代计算机:中旬刊 | 被引量 : 0次 | 上传用户:hsxy8848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式计算为大数据的处理提供一种新的平台,能有效提升算法的执行速度。在DBSCAN算法基础上提出一种数据分网格算法,该算法将每个分区上的数据集划分成以Eps半径为边长的单元格数据块,将查找Eps邻域的范围缩小到数据对象的八个相邻单元格之内,从而提高查找Eps邻域的速度及聚类速度,具有较好的加速比和扩展率。同时还优化分区聚类合并方法。
其他文献
最近一个月有没有以下的情形?如果有,请打钩。1.脑袋昏昏沉沉(头重重的)。2.眼睛疲劳(眼睛感到疲劳的情况较以前多)。3.有时会鼻塞(有时鼻子怪怪的)。4.有时会头晕(以前完全
当我们说别人的不是时,首先应审视自己。在一家公司待多少年才算现代标准的"忠诚"?我不知道标准答案,但知道如果在两年以下,一定不算。那是因为有一次我和我的老板一起面试一
随着家庭物联网的不断发展,如何高效存储海量的多源异构家庭物联网数据越来越重要。由于传统的关系型数据库不能满足家庭物联网海量的多源异构数据的存储需求,家庭物联网多源异构数据存储方案宜采用新兴的面向文档的非关系型数据库Mongo DB。结合Mongo DB的应用特点,提出一种适合于Mongo DB的从E-R模型向逻辑模型转换的转换原则,阐述Mongo DB数据库逻辑模型的建模过程,并在此基础上构建家庭
提出一种基于喷泉码、网络编码思想的数据备份方案。该方案基于喷泉码、网络编码的思想,并且具有纠删码的特性。在文件存储时,将文件块进行编码,产生很多编码块,对原始文件块
中共中央、国务院近日印发了《关于全面深化农村改革加快推进农业现代化的若干意见》。全文如下:2013年,农业农村发展持续向好、稳中有进。粮食生产再创历史新高,城乡居民收入差
实现一个Web人脸识别考勤系统,系统使用HTML5技术通过浏览器来获取人的面部图像,再引入tracking.js库,利用其中的FAST和Brief算法实现来对人面部图像的生物特征进行快速特征点提取、描述和匹配,最终完成考勤过程。这些HTML、Java Script代码和图像特征数据可以部署在HTTP服务器上,通过Web访问,形成一套B/S架构的人脸识别考勤系统。在任何地方,只要有一台有摄像头、可以
3月1日,我国首部专门针对农业保险的法规《农业保险条例》正式实施。该条例的实施将使2013年成为农险快速发展的新机遇期,也给尝试拓展农险业务的保险公司带来挑战。
一位白手起家的实业家,每隔一段时间就要去西双版纳原始森林,亲近一株板根如墙气根蓊翳的巨榕。我看过他从各种角度拍回来的巨榕照片,问过他:你是否以它励志,或展望自己企业?
随着雷达技术的不断发展,大多数现代雷达系统需要对一串回波进行相参处理,短期内频率稳定度和相位稳定度是雷达的主要性能指标,因此采用频率稳定度和相位稳定度极高的本机振荡器
研究运营商建设LTE D频段和F频段组网时开展双网的业务均衡时不同参数配置的效果,提出相应的优化方案,供后续无线网络优化人员在日常优化网优工作中参考。