布谷鸟搜索及其在双聚类分析的应用研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:Ling_cheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达数据反映的是直接或者间接测量得到的多个不同基因在多个不同条件下的表达水平,通过对这些数据的分析可以发现哪些基因的表达发生了改变,基因之间有何相关性以及在不同的条件下基因的活动是如何受影响的。它们在医学临床诊断、药物疗效判断和揭示疾病发生机制等方面有着重要的应用,且因为生物体中的细胞种类繁多和基因表达具有时空特异性等方面的原因,基因表达数据和基因组数据相比要更为复杂,数据的增长速度更快,数据量也更为庞大,因此对于基因表达数据的分析一直是生物信息学研究的一个重点和难点,同时由于单向聚类方法是根据数据的全部属性将数据进行聚类操作且只能寻找出数据集中的全局信息而非局部信息,但是大量的生物信息就隐藏在这些局部信息中,所以为了更好的分析基因表达数据,人们提出了双聚类的概念。本论文将布谷鸟搜索算法应用于函数优化问题和基因表达数据集的双聚类优化问题,分别以待优化函数和双聚类的均方残差为目标函数,本论文主要包括以下内容:1.在布谷鸟搜索算法的基础上提出了用于解决函数优化问题的自适应布谷鸟搜索算法。该算法以基准测试函数为目标函数,在布谷鸟搜索算法的基础之上做出了五个改进:(1)运用分散搜索中的初始化方式来对种群进行初始化操作,使得初始种群中的解可以更加均匀的分布在搜索空间当中;(2)以一定的概率来接受适应度值较差的解,以达到增强种群多样性的目标;(3)以随机生成的方式来处理种群中越界的自变量值;(4)对当前种群中适应度值最优的个体进行变异操作以增加算法的局部搜索能力;(5)加入更多的搜索策略和相应的动态调整机制,从而使得算法可以在不同的迭代阶段采取更加适合当前阶段的搜索策略。2.在布谷鸟搜索算法的基础上提出了用于解决基因表达数据集的双聚类优化问题的修改布谷鸟搜索算法。该算法以双聚类的均方残差为目标函数,在布谷鸟搜索算法的基础之上做出了两个改进:(1)以平分矩阵的方式初始化双聚类种群,使得初始种群中的双聚类可以更加均匀的分布在基因表达数据矩阵中;(2)将搜索步长和当前搜索所基于的那个双聚类的行数和列数关联起来,从而使得搜索步长可以随着当前搜索操作所基于的那个双聚类的大小的变化而变化。
其他文献
随着计算机软硬件和互联网技术的飞速发展,云计算技术得到了广泛的应用。各种不同规模的云数据中心在世界范围内普及开来。然而,如此数量庞大的云数据中心带来的是一个严重的
僵尸网络是融合了当前计算机病毒、网络蠕虫和特洛伊木马等恶意软件技术的、能够可控的发起各种网络攻击活动的平台。在与安全研究者的不断对抗中,僵尸网络使用各种网络协议
语音情感识别技术具有广泛的应用前景,因此语音情感的识别研究具有重要的意义。本文以生气、高兴、中性、悲伤四种情感状态为例,对情感特征的提取、选择以及识别方法进行研究,主
交通、电力、军事等关键领域对软件的可靠性和安全性要求越来越高,因为其严重关乎国民的人身和财产安全。C语言在上述基础领域软件的开发中有广泛的应用。C语言灵活高效的特性
本文首先介绍了H.264/AVC所使用的编码技术,H.264/AVC是较新的视频编码标准,它在以往视频编码标准的基础上进行了改进和升级。由于使用了新的编码技术,经过H.264/AVC编码的视频
近几年来,随着教育数据挖掘领域的快速兴起,结合数据挖掘方法对学生行为数据进行分析成为一种流行趋势,主要致力于对未来行为与兴趣的发现、对学生学习表现的预测、以及学生个人
随着互联网图像数据的海量增长以及人机交互系统的快速发展,如何对图像进行有效的组织分类,便于人们在浩如烟海的图像资源中快速找到想要的图像,成为人们越来越关注的问题。近年
个性化信息检索中用户偏好分析是信息检索领域的重要问题,其核心任务是在给定查询的基础上,通过分析用户的行为特征来挖掘用户的偏好,以获取符合用户查询倾向和符合客观规律的信
二维碎片拼接技术是计算机视觉与图像分析领域的一个有趣课题。由于碎片往往数量很多,人工拼接一般无法完成。为此,本文研究了一款基于形状分析技术的碎片拼接算法。首先,提
工作流技术是一种对某个工作流程及流程间各个操作步骤的抽象、概括和描述。之所以要发展工作流技术,重要原因之一是工作流可以实现企业生产的自动化,当满足给出的约束规则等条