基于最小生成树的K-均值算法设计与并行化实现

来源 :南京邮电大学学报:自然科学版 | 被引量 : 0次 | 上传用户:flysky1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据处理规模的不断扩大,对算法执行效率的要求不断提高。Spark作为基于内存计算的分布式并行化框架得到了前所未有的关注和广泛应用。为了提高聚类精度和效率,研究了Kmeans算法的改进及其在Spark平台上的并行化。针对K-means初始聚类中心选取的随机性问题,设计了基于最小生成树的K-means算法MST-K,该算法采用最小生成树对原始结点进行初始划分,减轻初始聚类中心随机选取对聚类结果的影响;采用余弦相似度公式来避免由于各属性衡量单位的差异性而导致的"相似不相同"问题。针对MST-K算法的执行效率
其他文献
随着作业成本法(ActivitP—basedCosting,ABC)在企业的广泛应用,作业成本法与目标成本控制、预算管理、生产管理等的结合应用理论及实务也不断得到发展。作业基础预算(Activity--b
首先归纳了常见射线跟踪法的优缺点,在此基础上详细阐述了入射及反弹射线法/镜像法的实现过程。然后针对典型的复杂室内环境,利用Wireless Insite软件平台建模仿真,研究分析移动
直觉思维能力是形象思维和逻辑思维的结合,小学生的思维是从形象思维向逻辑思维过渡,因而在小学培养直觉思维成为可能。加强基础知识教学、鼓励学生大胆猜想的同时注重分析思
期刊
据泛非网2014年5月18日报道,卢旺达教育委员会将对现行的学前课程、小学课程和中学课程进行修订,基础教育阶段将更强调学生的技能发展。卢旺达教育委员会课程发展主任乔伊斯透
低秩表示的目的是从整体上使得输入数据集的系数矩阵是低秩矩阵,但是它忽略数据集内部样本之间的关系,文中提出基于图正则化的低秩表示算法。在对传统低秩表示算法的求解中,通常是采用求解标准核范数的方式来近似矩阵的秩。标准核范数是计算矩阵的奇异值之和,然而矩阵的秩是计算非零奇异值的个数。因此,计算加权后的奇异值之和会更加接近矩阵的秩,进而文中提出基于图正则化的加权低秩表示模型。实验使用的是公开手写数字数据集
教书为育人,教书即育人。中学教育是基础教育,学科门类较多,各有特点,要求不一,如果不分门类,不注意特点,在众多学科中笼统地进行“两史一情”教育,就会造成内容上的重复,在
设计了一个基于计算机声卡进行水中声速测量的实验,该实验可以作为设计性和探究性实验应用到高中物理教学当中。
思维视角是人们观察思考问题时的角度、方位。在解数学题的过程中,多数人受思维定势的影响,习惯用一种模式化的思维方法去观察问题、解决问题,因此使一些问题难以解决,这就出
针对当前专利数据量庞大且难以分析的问题,基于尺度自适应核相关滤波提出一种专利数据挖掘方法。该方法在传统核相关滤波跟踪方法基础上,引入尺度自适应法进行关键词检索,给