【摘 要】
:
k-modes是一种代表性的分类数据的聚类算法。首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对
【基金项目】
:
国家自然科学基金(61103046);上海市自然科学基金(11ZR1401200)
论文部分内容阅读
k-modes是一种代表性的分类数据的聚类算法。首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对象就能计算出新的簇中心。为了使k-modes能够处理大规模分类数据,在Hadoop平台上用MapReduce并行计算模型实现了k-modes算法。实验表明:在处理大量数据时,并行k-modes比串行k-modes极大地缩短了聚类时间,取得了较好的加速比。
其他文献
<正>审判监督是法院进行案件纠错的重要制度,在体现司法公正和提高司法公信力方面具有十分重要的意义。近年来,随着审判监督改革的不断深入,特别是审判监督方式的改革,各地法
<正>据媒体消息,2018年1月—11月份,我国累计粗钢产量同比增长6. 7%;规模以上企业累计生铁产量同比增长2. 4%,低于粗钢产量增幅4. 3个百分点。由于废钢使用量增加,替代了铁矿
文章结合2000—2016年相关统计数据,计算贵州省城乡居民食物虚拟水消费情况,并利用灰色关联和预测方法分析其消费结构及趋势。结果显示:贵州省城镇居民虚拟水消费总量呈稳步
老子云:“道大,天大,地大,人亦大。域中有四大,而人居其一焉。人法地,地法天,天法道,道法自然。”这种崇尚自然,人文关怀的思想境界影响着孙为民的一生。孙为民的作品就充满
近年来,介孔二氧化硅纳米粒子(Mesoporous Silica Nanoparticles,MSNs)由于具有大的比表面积、可调的粒径、热稳定性等优点而受到关注,它在催化、吸附分离、传感器、尤其在生
<正>新《民事诉讼法》将原《民事诉讼法》的第178条修改为:"当事人对已经发生法律效力的判决、裁定,认为有错误的,可以向上一级人民法院申请再审,但不停止判决、裁定的执行。
介绍了非人类物种辐射影响评价方法中参考生物的选择目的、准则等,选取了符合我国西南地区某核场址环境生态系统特征的多种陆生参考生物。参考动物包括鼠、鸟、蜜蜂,参考植物
在电力系统中,避雷器的配置直接影响系统过电压和绝缘配合,对电力系统的安全稳定运行起着至关重要的作用。研究了750 kV变电站的避雷器配置对输电线路工频、操作过电压以及变
目的:分析阿司匹林+氯吡格雷治疗急性脑梗死的临床应用意义。方法:将2015年5月~2017年2月80例急性脑梗死患者作为研究对象并随机分组。单药治疗组单用阿司匹林治疗,联合治疗
<正>一、问题的提出天津市塘沽区人民法院在审理李宵诉天津市塘沽房管局房屋登记一案中认定,2004年4月12日,原告李宵从他人处以168万元人民币购买了坐落于塘沽区和平路199号