【摘 要】
:
数据挖掘是近年来很多领域竞相研究的一个热点,而聚类分析是数据挖掘的关键技术之一。聚类分析就是使用聚类算法来发现有意义的聚类,它在没有任何先验知识的前提下,根据数据
论文部分内容阅读
数据挖掘是近年来很多领域竞相研究的一个热点,而聚类分析是数据挖掘的关键技术之一。聚类分析就是使用聚类算法来发现有意义的聚类,它在没有任何先验知识的前提下,根据数据的相似性将数据聚合成不同的簇,使得相同簇中的元素尽可能相似,不同簇中的元素差别尽可能大。K均值聚类算法属于聚类分析算法中一种基本的且应用最广的划分方法,是一种在无类标号数据中发现簇和簇中心的方法。它的主要优点是简洁、快速。如果聚类结果是密集的,而且簇之间区别明显时,它的效果最好。对处理大的数据集,该算法是相对可伸缩的和高效率的。但在实际应用中人们发现,K均值算法可能受初始选定的聚类中心的影响而过早地收敛于次优解。因此本文主要针对K均值算法对初值的依赖易陷入局部极值而达不到全局最优的缺点提出了改进方案。引进一种全新的群智能算法——鱼群算法,该算法对搜索空间有一定的自适应能力,并且多鱼个体并行进行搜索,具有较高的搜索效率,可以使K均值聚类中部分陷入局部极值的点向全局极值处收敛。本文最后,分别对K均值算法和改进的基于鱼群的K均值聚类算法进行了实验。实验结果表明,该算法不仅克服了传统的K均值算法存在的问题,而且有较快的收敛速度。
其他文献
新闻是社会文化传播的重要方式.在互联网的帮助下,国际新闻走进了人们的生活,国际新闻编译成为人们了解世界的渠道之一.跨文化意识是新闻编译译者必不可缺的能力.本文从新闻
Web Services(Web服务)是基于网络的、分布式模块化组件,是建立可互操作的分布式应用程序的新平台。Web服务作为新一代分布式技术,一经推出,便以它的松散耦合性、跨平台及语言性而
在互联网飞速发展的背景下,海量数据是互联网发展的必然结果,而大规模数据的开放式共享则是网络时代的必然需求。由于系统的定制性和历史原因形成的数据封闭性、数据孤岛等难题
机会网络的概念主要来源于DTN和MANET。在机会网络中,节点都是随机移动的,它们无法预测下一次遇到的节点。网络中的节点采用的是“存储-携带-转发”的方式进行数据的转发。因
首先,广播影视部门将继续大力实施无线覆盖工程。国家从2006年开始投入30亿元,对全国转播中一广播和中一、中七电视节目的3032座台站的4758部发射机进行更新改造。2006年完成
当前我国新闻编辑的综合素质还有待提升,需要不断强化自身的修养,从而传递出适合社会发展的报道和文章.本文主要研究当前新时代背景下,新闻编辑的工作特点,并提出其需要具备
随着数字多媒体技术以及因特网技术的飞速发展,多媒体产品的安全问题成为目前一个相当重要而又富有挑战性的研究课题。数字水印技术是实现数字产品版权保护的一种有效方法,目
随着计算机网络的发展,对于传统的电视新闻来说,是机遇,也是挑战.现在人们接触到新闻的渠道增多了,而怎样进行深度报道显示出新闻的特色是其中的重点,只有这样才能够给观众耳
AVS是《信息技术先进音视频编码》系列标准的简称,是中国自主制定的音视频编码标准。随着数字视频压缩技术水平的迅速发展,AVS正在不断发展,越来越受到人们的广泛关注。论文
随着我国社会不断发展,我国电视台新闻事业也迈向了新的台阶.电视台新闻作为信息传播手段之一,是为人民群众提供信息的重要渠道.新闻稿件处理质量决定了新闻质量,为了能够为