【摘 要】
:
信息时代的到来,数据的指数级增长,自动从海量数据库中方便、准确地获取有用知识和发现数据间的有用模式已成为人们迫切的需要,也促使数据挖掘方法与技术的研究应用不断深入,推陈
论文部分内容阅读
信息时代的到来,数据的指数级增长,自动从海量数据库中方便、准确地获取有用知识和发现数据间的有用模式已成为人们迫切的需要,也促使数据挖掘方法与技术的研究应用不断深入,推陈出新。模糊聚类分析就是在这种背景下不断发展起来的一种数据挖掘方法,它将模糊理论引入聚类分析中,描述了每个对象隶属于每个类别的相似程度。随着数据挖掘技术的发展,模糊聚类分析得到了广泛的关注和研究。 目前对模糊聚类的算法研究,大多数是在硬聚类的基础上扩展而来。如基于目标函数的迭代爬山算法,此类算法存在一些缺陷,如容易陷入局部最优,对初值的设置敏感等。为了克服这些缺点,利用改进的蚁群算法进行优化。本文的主要研究内容和创新点主要体现在: (1)在讨论了蚁群算法的基本原理和现有的改进算法的基础上,提出了一种设立检测区的改进思路:在循环进行若干代后,进入检测区检测蚂蚁搜索路径是否停滞,如果停滞发生,自适应的改变相应参数,否则继续迭代。并给出了一种基于检测区和融合现有改进策略的混合自适应蚁群(CAAC)算法。 (2)把改进的蚁群算法应用到模糊聚类算法中,分析并设计出了一种基于混合蚁群算法的模糊聚类算法(CAAC-FC)。通过降元和降维的操作,将基于目标函数的二元模糊聚类问题转化为关于聚类原型矢量的一元函数,利用CAAC算法求解目标函数的最优解,完成聚类任务,同时给出了程序流程图和算法具体步骤。 (3)进行了相关算法的实现和验证。对CAAC算法的仿真结果证明,此算法具有收敛速度快,全局搜索能力强的优点;关于CAAC-FC算法的对比实验结果表明,新算法无需设置聚类初值,能够跳出局部最优,聚类准确度高、效果好。
其他文献
DNA序列拼接是基因组测序的核心问题之一。从1977年Sanger测序技术发明开始,到2005年第二代测序技术问世这段时间,DNA测序主要采用Sanger测序技术。Sanger测序技术测得的DNA片
人眼检测是人脸检测和人脸识别的一个中间步骤,是自动人脸识别系统中必不可少的一部分。近年来,随着人脸识别在各个领域的广泛应用,人眼检测已经成为计算机视觉领域的研究热点,很
在经济全球化中,海洋集装箱运输业发挥了重要的作用。由于集装箱运输量的迅猛增加,集装箱码头已成为物流网络的重要组成部分,它的运营效率也受到越来越多的关注。码头的效率
在计算机图形学领域,研究人员一直努力利用计算机再现身边的真实世界。水面模拟作为自然景物模拟的一个分支,一直以来都是计算机图形学中的热门研究课题之一。水面约占地表面积
报表本质上是结构与数据相结合的文档。报表工具是辅助用户快速、高效设计各类报表的软件系统。在分析研究当前国内外报表工具体系结构的基础上,作者实现“双两段式”报表工
如何合理高效地组织图像数据、结合图像特征,将人工智能及知识发现等技术合理地运用于图像分类中,是当今计算机视觉研究领域的一个热点问题。量子进化算法以其诸多优点,如能
压缩感知(Compressed Sensing或CS)不同于传统的数据获取理论,它可以使用远比传统方法少的测量或者样本来恢复确定的信号或图像。为了实现这个目标,CS依赖于两个规则:稀疏性和
信任模型可为用户访问互联网提供安全体系,访问控制和认证技术可以进一步提高用户访问系统的安全性。 本文以研究信任模型为主线,对分布式网络环境下信任模型及相关领域做了
当今,多样化的传播途径和复杂的应用环境给网络蠕虫的快速传播提供了条件。从发现漏洞到对应蠕虫爆发的时间越来越短,从蠕虫爆发到蠕虫被控制的时间越来越长,并且几乎每次蠕
P2P业务流量在对互联网应用起巨大推动作用的同时,也消耗了大量的网络资源,妨碍了正常网络业务的开展。为了保证网络能正常有序的运行,有必要对P2P流量进行识别,从而进行控制