基于混合蛙跳的数据挖掘模糊聚类算法研究

被引量 : 7次 | 上传用户:kof00000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十几年来,随着计算机技术、通信技术、网络技术的迅速发展与广泛应用,企业面临着日益增多的业务数据,一方面,这些丰富的数据资源为企业提供能带来商业利润的决策信息;另一方面,企业生产过程的科学研究以大量的数据为基础,需要通过一定的方法和手段进行分析、处理,可以实现生产过程的过程辨识、故障诊断和控制决策等工作。因此,数据挖掘作为一种从大量的、复杂的数据中提取有用信息的技术手段,引起了学术界和工业界的广泛关注。混合蛙跳算法是一种模拟青蛙群智能搜索行为的群体协同搜索算法。由于其控制参数少、易于实现、编程简单等优点,已被越来越多的学者所关注。模糊C-均值聚类(FCM)和核模糊C-均值聚类(KFCM)算法虽然已被应用于模式识别、图像处理等众多领域中,但仍存在一些缺陷。本文针对FCM算法存在对初始值敏感和易陷入局部极小值的缺点,提出了一种基于混合蛙跳的模糊C-均值聚类算法(SFLA-FCM)。核模糊C-均值聚类(KFCM)算法在一定程度上克服了对数据形状分布的依赖,但仍存在对初始值敏感、易陷入局部极小值的缺点。为此,本文提出一种基于混合蛙跳的核模糊C-均值聚类算法(SFLA-KFCM)。用SFLA优化KFCM算法,对于聚类数较少的数据集获得了理想的结果。但在聚类数较大和维数较高时,聚类效果较差,为此提出首先将自适应惯性权重引入混合蛙跳算法的更新策略中,再用改进后的混合蛙跳算法求得最优解作为KFCM算法的初始聚类中心,然后利用KFCM算法优化初始聚类中心,最后求得全局最优解,从而有效克服了KFCM算法的缺点,更适合高维、聚类数较多的数据集。用SFLA优化FCM算法,对于聚类数较少、维数较低的数据集获得了理想的聚类结果。但在聚类数较大和维数较高时,聚类效果较差,从而提出两种改进的SFLA算法。第一种,先将线性递减的惯性权重引入蛙跳算法的更新策略中,并按照一定的概率选择适应度值较优的青蛙代替较差青蛙,并对每只青蛙个体以不同的概率变异。第二种,先用混沌的Tent序列初始化青蛙群体以增强群体的多样性,提高初始解的质量;再根据每只青蛙的群体适应度方差值选取不同的变异概率进行变异。然后分别用改进后的蛙跳算法求得最优解作为FCM算法的初始聚类中心,然后利用FCM优化初始聚类中心,最后求得全局最优解,从而有效克服了FCM算法的缺点。
其他文献
各种国际法教科书、专著对条约的定义都做了大同小异的规定,例如,《美国对外关系法重述》中将条约定义为“国家或国际组织间的一项协议,用以表明创立、改变或限定受国际法支
随着我国经济和人口的迅速发展,地震灾害的不断发生,我国对抗震设计的要求也越来越高了。为了更好的研究地震作用对结构非线性的影响,桥梁的非线性分析得到了飞速的发展。一
食品安全溯源体系,最早是1997年欧盟为应对“疯牛病”问题而逐步建立并完善起来的,是保障食品质量安全,实现食品质量全方位全过程监管,提高质量监控透明度的一项重要措施。依
在药物研发过程中,造成药物研发成功率较低有多种因素,主要可以总结为两类:一类为药物候选化合物物的物理化学性质及体内吸收、分布、代谢、排除及毒副作用(Absorption, Distribu
仔猪副伤寒(Swine paratyphoid)是由沙门氏菌属中的致病性细菌引起仔猪的传染病。急性病例为败血症变化,慢性病例为大肠坏死性炎症及肺炎。本病大多发生于1~4月龄仔猪,成年猪很
我国中小企业数目众多、分布广,社会贡献显著,但中小企业发展却存在资金、技术、人才、高效收集和利用企业外部信息和情报等方面问题。中小企业竞争情报系统可以解决其发展中的
城市民营养老机构被定性为福利性或非营利性机构,必须体现其社会服务功能和公益性价值,然而由于注入了私有资本,在市场化的经济改革中,它又必须遵从市场规律,追求经济效益。这两种
目的:探讨子宫内膜癌中雌激素受体(estrogen receptor,ER)、孕激素受体(progestin receptor,PR)、p53、Ki-67、Survivin的表达及临床、病理因素与子宫内膜癌与预后的关系。方法:收集2
人才需要培养。员工的培养是企业人力资源开发的重要内容。重视人才的教育和培训,构建科学合理的企业教育培训体系,高效有效地健康运转能使员工的知识、技能与态度明显提高和
风力发电机组是将风能转化为电能的设备,其运行的性能直接影响着能量转换效率和发电量。齿轮箱是双馈式风电机组的关键部件,由于风电机组所处环境和所受载荷的特殊性,造成了