基于PSO的双向聚类算法研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:testsininet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是一门结合了生物学、计算机科学、数学和化学等领域知识的交叉学科。随着科技的飞速发展,基因测序技术的研究取得了重大突破,人们逐渐开始对基因的功能和内在机理展开了探索研究。目前,每天都会产生海量的基因信息数据,生命科学的研究重点也从如何获取生物数据转移到了怎样对这些数据进行有效的分析上面。目前,对基因表达数据的分析处理,主要采用的方法是聚类。一般的聚类只能从基因矩阵的行或者列单一方向进行,这种方法只能找到基因表达数据矩阵中的全局信息。而大量有价值的生物学信息往往就隐藏在这些局部信息中,双向聚类是一种能有效解决该类问题的新兴手段。随着双向聚类得到越来越多的应用,现存算法的缺点与不足也逐渐暴露了出来,因此研究双向聚类问题是很有必要的。本文的研究目的是利用粒子群算法解决双向聚类问题,并通过一系列实验对比说明了结合粒子群优化的双向聚类算法的优越性。本文主要做的工作如下:(1)双向聚类算法是一种局部搜索算法,对于繁杂的基因数据矩阵,直接对其整体进行双向聚类,计算量大且聚类效果不理想。本文在粒子群算法的基础上,使用总体类间差异先对整个基因矩阵全局寻优,找出有一定相似性的基因子矩阵,再对其进行添加或删除行列的操作。使得到的双向聚类结构更加规整,避免了基因表达数据不均衡分类的情况。(2)双向聚类算法是一种多目标优化算法,FLOC算法作为经典双向聚类算法之一,却不能很好的同时优化多个目标。结合PSO算法,对FLOC算法的目标函数做出修改,提出了PSO-FLOC聚类算法,通过实验对比发现,PSO-FLOC算法对多目标优化问题表现更佳,并对算法中参数的取值进行了讨论。(3)在粒子群算法中,粒子只能沿着特定的轨迹搜索,从而不能保证以概率1收敛到全局最优,甚至不能收敛到局部最优。为了提高算法的全局搜索能力,结合具有量子行为的粒子群优化算法,形成了QPSO-FLOC聚类算法,并通过实验与PSO算法进行了分析比较,证明QPSO-FLOC算法能取得更好的聚类效果。
其他文献
分组调度算法对网络性能和网络服务质量有重要影响。基于轮循的调度算法是应用最广泛的分组调度算法类之一,DRR算法是其中的经典,SRR算法是DRR算法的一种改进。DRR算法和SRR
人脸识别技术是一种生物特征识别技术,由于其数据采集的友好性、面部的客观性以及应用场景的多样性,使其已成为模式识别与深度学习方面的研究热点。但人脸识别在具体应用过程
热点话题的发现一直都是自然语言处理领域常见的研究课题。在网络舆情监控方面,需要实时发现老百姓讨论最多的新闻事件,特别是网民对网络突发性事件的热议。及时对这类事件进
相对于我国古代先进的建筑技术成就,我国在古建筑的计算机建模还比较落后,急需利用现代信息技术手段,对古建筑的保护和开发进行探索和研究。本文选取唐朝风格的古建筑(简称古
集成聚类技术由于具有较好的泛化能力,已引起了研究者的高度关注。目前,在集成聚类领域已经取得一些显著成果,针对不同的应用需求提出了不同的集成聚类算法。然而,已有算法能够处
巡回旅行商问题(TSP)是一个组合优化方面的问题,已经成为测试组合优化新算法的标准问题。从理论上讲,使用穷举法不但可以求解TSP问题,而且还可以求出该问题的最优解。但是对现有的
随着互联网的不断普及和各种图像采集设备的持续发展,图像作为人类感知世界的重要信息源,在实际中的应用也变得更为重要。如何从海量的数字图像集合中快速查找目标图像,是研究的
随着计算机通信技术、微电子技术和传感技术的发展,无线传感器网络应运而生。无线传感器网络作为一门新兴的、多学科的前沿性技术,集成了多种先进技术与理念,将虚拟的信息世界与
群体现象在自然界中普遍存在,如南迁的鸟群,水中的鱼群,人群等等。群体仿真近年来逐步成为虚拟现实领域的研究热点,并且普遍应用于实时仿真和虚拟娱乐领域。群体仿真的主要目的是
随着信息技术的高速发展,特别是人类社会进入互联网时代,海量的数据信息随之产生出来。一方面人们得以享受到以往任何时代都无法想象的信息资源,但另一方面,针对这些海量的有价值