【摘 要】
:
随着如今数据量的爆发式增长,传统的数据挖掘方法已经远远不能满足人们需求,K-means聚类作为一种经典的聚类算法,其应用领域很广。但是K-means算法在随机选取初始聚类K个中心
【机 构】
:
天津师范大学计算机与信息工程学院,天津职业大学基础课部
论文部分内容阅读
随着如今数据量的爆发式增长,传统的数据挖掘方法已经远远不能满足人们需求,K-means聚类作为一种经典的聚类算法,其应用领域很广。但是K-means算法在随机选取初始聚类K个中心时,容易使聚类结果不稳定,因此提出基于核函数的K-means聚类算法。与此同时,结合MapReduce分布式框架对改进后的K-means聚类算法作分布式计算。研究结果表明,基于高斯核函数的K-means聚类在分布式下的计算能够加速K-means聚类过程,且结果优于单独基于核密度估计的K-means算法。
其他文献
随着我国网络技术快速发展,智能手机的普及,不断扩大了我国互联网用户规模,逐渐产生了手机客户端、微信以及微博等新媒体传播渠道。全媒体时代,自媒体和多媒体信息传播相互融
微博的普及导致微博平台数据量日益增长,因此从海量微博中快速准确地为微博用户推荐好友成为了巨大挑战。用户的社交网络和微博文本在一定程度上体现了用户的价值观和兴趣爱
文章分析了知识管理在企业战略决策中的作用,并结合战略决策的特点讨论了如何借助系统动力学分析方法实现基于知识的战略决策.
中学作文教学中的宏观扩展与微观把握程国生(湛江师院附中湛江524048)作文无疑是语文综合能力的集中表现,无论是词句、文体、结构等知识要点,还是观察、思考、表达等运用能力,巨细无遗地
针对不均匀数据集的抽样问题,已有随机抽样算法、基于固定网格划分的单维度算法、基于可变网格划分的单维度算法,但仍无法更好地反映数据分布特征问题。在数据挖掘的实际应用
近些年来,随着人们对纪实体裁影视作品关注程度的提升,电视纪录片的数量也与日俱增,纪录片用其独特的影片拍摄方式为人们展示了更多真实、深刻的内容。电视纪录片与民生新闻
在煤矿开采中所出现的顶板安全事故,掘进工作面冒顶事故的发生率是最高的。因此本文探讨了煤矿掘进工作面常见冒顶事故的原因,介绍了煤矿掘进工作面冒顶事故发生之前的预兆以
目的观察双切口超声乳化术联合小梁切除术治疗闭角型青光眼合并白内障的临床效果,为临床治疗闭角型青光眼合并白内障提供指导经验。方法选取2015年5月~2017年4月在我院治疗的
近年来,高职院校更加重视实践人才培养教育,而在医学类高职院校里,化学课40%内容是实践为主,学生在化学实验中学到的操作技能将给以后临床检验、药品分析检验等工作打下良好
为解决传统反外挂技术难以有效防御基于Accessibility Service的Android应用程序外挂问题,通过反编译已知的基于Accessibility Service的移动外挂插件,从AccessibilityServic