带交叉变异算子的自适应粒子群聚类算法的研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:njpolice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘中一项重要的挖掘任务。所谓“物以类聚”,聚类分析从大量数据对象中寻找数据属性间的相似性,并以此为数据对象分类,从而达到和优化大规模数据的查询和发现隐含有用信息的目的。本文着重对聚类分析中应用最广泛的是基于划分的聚类方法——K-means聚类方法进行了深入地研究,并对其优缺点进行了分析,该算法具有思想简单、结构简单、执行效率高等优点,但是算法也存在着对初始聚类中心敏感、容易陷入局部最优的缺点,而这两个缺点也是制约该算法应用的主要原因。为了改善K-means聚类方法对初始聚类中心敏感、容易陷入局部最优的缺点,本文采用具有全局寻优能力和更高分类准确度的改进型粒子群算法与K-means算法相结合。其中主要研究工作包括:(1)对标准粒子群算法惯性权重因子的研究。由于标准粒子群算法中粒子飞行方向与速度对惯性权重w的依赖性强,本文提出了惯性权重改进方案,即随粒子群算法执行过程动态变化的自适应惯性权重。(2)设计了基于适应度为基准的交叉操作,这样保证了种群中粒子的多样性,加强了粒子的全局搜索能力,也加快粒子群收敛速度。提出了基于群适应度标准差的变异操作,变异操作通过粒子群的群体适应度标准差σ2和当前粒子理论最优值fgbest来控制粒子的变异概率。同时,构造了比较直观的适应度函数。粒子群算法中适应度函数至关重要,特别在本文中适应度函数不仅直接影响交叉算子对粒子的操作而且决定着变异操作,这样适应度函数将会影响聚类中心点的优化及聚类划分的情况。在本文中所给出的适应度函数主要依据类内总的离散度,即通过类内尽量紧凑、类间尽量松散的原则来构建。(3)将改进后的粒子群算法与K-means聚类算法融合。给出了把粒子群优化算法引入到K-means算法中去的粒子的编码方案和算法流程。通过两种算法的结合改善K-means算法对初始聚类中心选择敏感等问题。文章最后将基于交叉变异算子的自适应粒子群聚类算法应用到UCI学习型数据库中,并通过将该文提出的聚类方法与K-means聚类算法、基于遗传算法的聚类算法、基于粒子群算法的聚类算法作比较,从实验结果可以看出,本文中提出的聚类算法较上述三种算法拥有更好的适应度值和分类正确率并且算法更加稳定,因此,本文的方法改善了K-means聚类算法对初始聚类中心敏感和容易陷入局部最优的缺陷。
其他文献
基于内容的视频检索技术指根据用户提交的示例视频,在视频数据库中查找与其相似的视频片段,并将查询结果按相似程度的高低反馈给用户。显然视频序列相似性度量算法的好坏是决定
移动到移动(Mobile to Mobile, M2M)通信系统是一种端到端的无线通信。在无线链路M2M信道中必不可少的会出现的多普勒频移。当两个终端移动速度较快,那么多普勒频率变得非常
学位
塑料外壳式断路器是低压配电保护系统的核心元件,具有的性能和优点使其在电力系统中被广泛的运用,它的可靠性对配电系统的安全性有很大的影响。因此为了保证断路器的可靠性,出
在现代各种通信系统中,语音通信一直是一项重要的、必不可少的业务。语音压缩和编码在移动通信、VoIP、多媒体信息传输、保密通信等领域发挥着重要的作用。多种语音编解码的国
深空通信信道中各信号间的传输距离非常远,能量衰减严重,所以必须努力提高系统的信道增益和接收机的灵敏度。作为深空测控通信中的一种重要技术,信道编码技术能够大幅度地提
学位
无线通信的高速演进,使得具有感知和计算能力的终端设备具有了移动性,这也促进了基于现有通信设备的位置服务的发展,以满足用户不断变换场景的需求。为了支持位置服务的交互性,准
协作通信通过共享移动终端的天线来提高无线通信系统的容量或传输可靠性,有效对抗了信道衰落的不利影响,降低了服务中断概率。自适应传输是在满足目标误比特率的情况下,通过
数字水印技术作为多媒体数据的版权保护工具,受到了人们的高度关注,随着计算机网络技术的深入发展,数字水印技术在当今信息化社会中日趋重要。本文简要介绍了数字水印基本理