分布式最小生成树聚类的设计与实现

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:hensontan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘的主要问题之一,聚类算法能够在没有任何数据先验知识的情况下对数据进行分群,从而找到数据中的有价值的信息。近年来数据挖掘在电信领域的应用越来越广泛,但是由于数据量、数据类型、计算复杂度等原因,聚类算法应用的却不多。提出一种新的适合于分布式计算的最小生成树算法,结合适合的相似度度量,设计了一种用于解决海量数据分析的分布式聚类算法,并给出了基于mapreduce编程模型的分布式实现。
其他文献
压铸机工作环境恶劣,干扰较多,使参数发生较大变化,影响系统的稳定性,传统的PID线性控制在被控对象发生变化时,控制特性也随即发生变化。针对这个缺点,采用自适应模糊PID控制
为了探究面向智能终端的数据业务QoE测量方法,通过分析QoE研究现状和数据业务用户体验特性,以时延、抖动、信息丢失为依据,建立了针对现有数据业务QoE的立体分类模型。在分析
针对文本自动分类问题,提出一种基于概率型神经网络(PNN)和学习矢量量化(LVQ)相结合的文本分类算法,该方法借助TFIDF方法提取文本特征及特征值,形成文本分类特征向量,利用概率型神经
为了解决空调遥控器不兼容问题,设计了一款基于Atmega16单片机的智能空调遥控器。该遥控器采用测量脉冲宽度的方法学习红外信号,同时使用游程编码算法对数据进行压缩后存储,并利用单片机内部定时器PWM模式产生红外载波,成功实现了对红外遥控的学习与再现,并可通过上位机进行控制。经运行测试表明,该智能遥控器操作灵活,性能稳定,为智能遥控器设计提供了一种新方案。
Fick第二定律是固体物理学中关于非稳态条件下的扩散宏观理论基础,动态扩散过程的可视化模拟将有助于研究人员直观快捷地了解和掌握物质扩散对周围物质和环境的影响.使用vn(实现
为了应对系统中通讯接口的日益多样化,基于设计模式提出了统一接口模型和数据到达通知模型,使数据源层的通讯接口解耦于领域层的功能模块,实现了接口的动态配置和同构冗余,并
现代汽车中的电控功能越来越多,不同ECU之间传递的信息量也就越来越大。XCP协议的高速性和稳定性非常适用于汽车中的实时测量及ECU内部数据标定。设计了一个基于XCP-on-CAN协
针对传统基于内容相似度的事件关系计算方法不能分析出事件间的潜在关系的问题,提出了基于FCA的事件关系计算方法。该方法利用根据话题的三层结构模型,对话题中的事件进行属
解决如何用计算机生成具有民族风格的纹样的图案是一个富有挑战的问题。提出一种图案生成方法,基于图案基元的变换来快速生成具有民族风格的图案。首先,引入交互分割模型提取图案中具有代表性的意义相对独立的图案基元。设计图案基元的相似变换规则,产生分形基元矩阵。然后引入准Arnold变换规则,对基元分形矩阵进行扰动生成新图案。对图案基元进行变换、扰动不仅生成多种纹样图案,而且由于变换中图案基元的保留,使得生成
基于超宽带体域网以及多视点视频编码技术,设计了一个面向穿戴式应用的全景视频监控系统,其中着重研究了全景视频采集、编码与传输的关键技术。在穿戴式全景监控系统中,体域网节