【摘 要】
:
在分析Hadoop平台架构和Canopy-Kmeans聚类算法的基础上,对Canopy-Kmeans算法进行了并行化优化改进,通过统计学思维对数据分组抽样后聚类以方便并行化和降低时间复杂度,利用
【基金项目】
:
福建省教育科学“十三五”规划重点课题(项目编号:FJJKCGZ16165)
论文部分内容阅读
在分析Hadoop平台架构和Canopy-Kmeans聚类算法的基础上,对Canopy-Kmeans算法进行了并行化优化改进,通过统计学思维对数据分组抽样后聚类以方便并行化和降低时间复杂度,利用最小最大原则优化Canopy初始中心点选取,用数据异度均值抽样法保证从原数据中均匀提取数据样本,并对Kmeans迭代计算过程进行优化.结合Hadoop平台下MapReduce框架将改进算法进行并行化设计实现.实验表明,对海量数值数据进行聚类时,改进的Canopy-Kmeans并行算法是有效的、收敛的,在聚类准确率和
其他文献
研究了金探针对沉积在金(111)表面的CH3(CH2)15S自组装膜的纳米压痕的分子动力学模拟.结果表明,自组装膜在金探针的作用下出现了跳跃接触现象,倾角和法向载荷都出现明显的滞
重载制动摩擦磨损特性制约着刹车装置的刹车性能及其使用寿命,在MM-1000试验机上,对等离子涂Fe-Ni-Co-WC涂层的重载制动摩擦特性进行了试验研究,结果表明,在相同的试验条件下,等离子喷涂涂层分别与石
选取人均国民收入和城镇居民人均可支配收入两个经济变量,依据1994—2014年统计数据,利用VAR模型和OLS方程,通过平稳性检验、残差自相关检验和协整分析,进行人均GDP与人均可支配
勘察设计企业属于咨询类行业,在国外类似的勘察设计企业大多都是一些私人事务所或者是合伙制的公司,规模一般都较小,这在一定程度上是由本行业的特性所决定的。由于规模较小,且其
通过对现场获取的波磨钢轨进行铆钉上,硬度试验分析,探讨了钢轨波磨的形成机理,发现钢轨波磨主要是因为轨面的不均匀塑性变形所致,机车车辆结构的相似和列车运行速度的趋近将加速
上半年,上海市全社会固定资产投资完成1396.23亿元,比去年同期增长25.9%。
目前对于衍生金融工具的定义,世界各国还没有一致的公论。根据国际会计准则委员会(IASC)在IAS32《金融工具:披露与列报》中的定义,衍生金融工具,指具有以下特征的金融工具:1、其价
优秀乡土文化是中华文明重要的精神积淀,增强文化自信、完善文化治理,都需要传承和发展好这-重要文明成果.通过对现代化变迁中优秀乡土文化传承主体、传承环境和传承实践的历
“十五”期间是上海轨道交通的集中发展期,将建设运营长度达200多公里的9条轨道交通线路,总投资约1000亿元,初步形成上海轨道交通骨架网络。为此,上海市政府正深化轨道交通投融资
5月18—24日,应老挝人民革命党邀请,中共中央文献研究室主任冷溶率中共友好代表团访问老挝。5月24日-30日,应中共中央对外联络部邀请,东帝汶民主党总书记兼政府农业和渔业部长马