Binary-Positive下的并行化CURE算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:power_gq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当CURE算法在处理不均匀的海量数据时,针对随机抽样不具有代表性的问题,提出了一种健壮的并行化改进算法。该算法使用Binary-Positive算法得到原始数据的有效属性,并利用MapReduce并行框架对有效数据进行层次聚类,从而实现了正确率与效率的一种权衡。实验分析表明,改进后的CURE算法具有更高的执行效率,且聚类效果良好。
其他文献
当今远程开放教育正在蓬勃发展,多媒体,计算机网络技术促进教育结构和教学模式的转变.现代远程教育的基本学习形式是研究性学习,它改变了以往以教师为主体向学生传授知识的教
遗传学的发展使人应接不暇,但遗传学教材的建设恐令人喜忧参半.在高校教学改革的新环境下,遗传学教材的建设面临课时大幅减少,内容更新快,重视不够,投入不足,各自为政,良莠不济等诸多
对范德瓦尔斯方程中a,b项的修正一直是提高状态方程计算准确度的方向之一.随着实验方法的不断发展,对其的修正方法也在不断的出现.本文从绝热节流过程出发,推导出了焦耳-汤普森系
随着信息技术的发展,计算机犯罪活动越来越多.如何利用计算机取证技术搜集电子证据、惩治犯罪,已成为人们关注的焦点.文章首先介绍了计算机取证的概念、原则和方法,并通过一
目的:观察血府逐瘀胶囊对大鼠急性心肌缺血及心肌线粒体超微结构的影响。方法:采用冠状动脉左前降支结扎制备大鼠急性心梗模型,给药5 d,通过死亡率、心电图、心脏超声心动、血
针对牛顿插值算法信息利用率不高的缺点,提出了一种改进的单帧图像超分辨率算法。利用源图像中的像素点信息,同时从多个方向计算牛顿插值结果,并根据源图像中各像素点的相关性通过融合计算获得超分辨率图像的插值结果。该方法既提高了源图像中信息的利用率,又减小了插值误差的累积。仿真实验结果表明,利用改进方法所获得的超分辨率图像更细腻清晰,尤其图像边缘区域所包含的大量细节信息可得到有效恢复。改进算法所获得的超分辨
基于MATLAB仿真平台建立了高知识群体失业率预测的BP神经网络模型,应用数据插值及曲线拟合的方法,补充了高知识群体失业调查中未采集与未公布的数据,解决了失业率预测中的不
为了满足数据挖掘的需要,本文提出了一个基于决策树的胃癌临床医疗信息分析应用研究模型.该模型是从业务数据库或数据仓库中抽取与胃癌术后复发因素有关的数据,形成决策树的
具有群一致特性的多属性协同决策(MACD)技术对于支持供应链中复杂多变、资源动态的大型群体供应商与客户B2B协同是十分重要的,现有的群一致性模型存在明显不足:难于管理较大群体,
本文介绍了一个新的函数类B1(λ,α,ρ),研究了它的一些性质,进一步得到了一些有趣的μ为复数的Fekete-Szego不等式,得到了准确结果,所得结果推广了一些作者的相关结论。