基于Spark平台的聚类算法的研究和实现

来源 :电子世界 | 被引量 : 0次 | 上传用户:hrbqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的聚类算法是从要聚类的样本中任意挑选指定个样本作为中心点开始聚类,中心点选取不同,聚类算法每次执行的结果可能不一样,这样会导致不稳定的结果。为了使聚类结果更加稳定,在聚类算法开始之前怎样得到准确的中心点个数以及正确地挑选合适的初始中心点的研究具有非常重要的价值。Meanshift算法”是一种非参数密度估计算法。Meanshilt算法可以通过不停的循环调用,可以很快地收敛于概率密度函数最大的地方。算法的过程就是不断寻找概率密度局部最大值的过程。通过Meanshift算法可以很快的找到中心点。
其他文献
直接数字频率合成器(DDS-Digital Direct Synthesis)是一种数字频率合成方法,有频率分辨率高、相位连读等优点,但存在杂散信号的影响。本文针对DDS杂散信号的抑制,提出了噪声中
2010年7月8日上海世博会意大利馆迎来了托斯卡纳大区展。在意大利馆二楼,一个190平方米的展区滚动播放精心制作的视频,托斯卡纳的再生能源和可持续发展的成就,城市的历史和艺术
伴随着工业化与城市化的快速推进,我国的城市形态与社会结构发生了重大而深刻的变化,产生并出现了多个超大型人口规模城市。超大城市不仅是人口流入的主要地理空间,而且是形
近期实施的《北京市限价商品住房管理办法(试行)》规定,“限价房5年内不得转让”。与此相类似,去年9月底发布的《北京市经济适用住房管理办法(试行)》规定“购买经济适用房不满5年
文学是语言的艺术,文学的任何价值都是通过语言得以实现的。当“语言符号能唤起读者的想象,以其较小值换取最大意义的交流时,就构成了文学语言的张力美。文学语言的张力美具体体
入侵者会通过破解安全保护机制为第三发应用带来很大的安全风险,使得第三方应用存在着很大的漏洞,设计一种应用安全保护机制非常必要。本文从基于第三方应用平台的应用安全保护机制的功能出发,对其功能和设计进行阐述,旨在弥补当前安全保护机制的不足。
读《梅花几度梦里寻》,如置身于梅花盛开的梦境,时而在“花枝招展、争奇斗艳”的上海梅花展,时而在“既热情奔放又带几分肃穆”的肇庆梅庵,时而又在“令人目迷五色,神驰心醉”的中
甜玉米(Zea mays L.Saccharata Sturt)起源于美国。1924年育成第一个甜玉米杂交种。40年代以后,随着甜玉米杂交种的发展,栽培面积迅速扩大。现在世界常年播种面积600多万亩,
由于电梯厅门的种类以及发运箱种类多,如何实现自动装箱是亟待解决的问题。本文根据装箱工艺及相术要求,研发了一种智能电梯厅门直角坐标装箱机械手系统。该系统可以根据合同
从世界各国历届参与国的经验分析.成功举办世博会.推动了所在城市社会经济的发展.特别是加快了其周边区域开发的步伐。如.1970年在日本大阪举办的世博会,促进了日本的国际化,创造了