基于磷虾算法的癌症微阵列数据特征选择方法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:jjxjt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因芯片技术在癌症研究中被广泛应用,大量有价值的微阵列数据被迅速积累,利用这些数据进行癌症标志物挖掘是生物信息领域的研究重点。微阵列数据为从分子层次上对癌症进行诊断、分型、致病机理的研究以及药物的快速开发提供了极大的便利,对癌症的早期诊断和治疗具有重要的研究意义和应用价值。然而,这些数据具“高维度小样本”的特点,其中包括大量噪声或冗余基因。面对这些数据医学专家在短时间内很难高效的对其进行分析。如果直接通过数据分析算法对这些数据进行建模处理,过多噪音和冗余的特征将极大降低算法的性能,提高计算复杂度,造成“维数灾难”。针对这一问题最有效的解决办法是特征选择(Feature Selection,FS)。特征选择已被用作降低数据维度的有效方法,并且在生物医学领域引起了越来越多的关注。其中,基于wrapper的特征选择方法利用特征子集的分类性能来获取最佳特征子集,因其具有更高的分类精确度和灵活性受到了广泛关注。搜索算法是wrapper方法中最重要的组成部分,对该方法的性能有很大影响。基于种群机制的元启发式算法通常作为wrapper方法的搜索算法。磷虾群优化算法是近年来提出的一种高效的元启发式算法,已经被广泛应用到经济负荷分配、训练神经网络和网络优化等问题当中。本文对磷虾算法进行改进,并将其应用到癌症微阵列数据特征选择中,主要研究成果如下:(1)针对二进制磷虾算法(Binary Krill Herd,BKH)在微阵列数据特征选择中存在搜索特征子集能力不足,易陷入局部最优和过早收敛的问题,本文提出改进的二进制磷虾算法,简称IGMBKH。首先,IGMBKH算法基于信息增益(Information Gain,IG)值选择一些排名靠前的特征用于指导初始解的构建以获得更好的初始种群。其次,在改良的二进制磷虾(Modified Binary Krill Herd,MBKH)算法迭代搜索阶段将混沌记忆权重因子引入到算法的操作算子中以促进磷虾算法进行更深入挖掘和开发,从而进一步增强算法的搜索能力。最后,为了避免陷入局部最优和过早收敛,在磷虾算法中使用双曲正切函数和自适应传递因子将磷虾个体的位置映射在二维空间。在六个癌症微阵列数据中的实验结果表明,与BKH、MBKH、其他经典和新近的特征选择算法相比,IGMBKH算法在使用更少特征数的情况下可以达到更高分类精度。在癌症微阵列数据特征选择中,IGMBKH算法可以进行更深层次的搜索,具有更强的搜索能力。因此,该算法可以作为理想的预处理工具,能够有效的对高维微阵列数据进行降维,更好的挖掘癌症数据中的特征。(2)改进二进制磷虾算法IGMBKH在搜索特征子集方面具有较强的竞争力,但相对来说单个磷虾算法IGMBKH存在收敛速度慢的不足,而二进制黑洞算法(Binary Bl ack Hole Algorithm,BBHA)是一个为数不多收敛速度快的算法。鉴于两个算法之间的互补性,本文提出一个自适应划分双种群的混合磷虾黑洞算法,简称IGMBKH-BBHA。IGMBKH-BBHA算法通过使用自适应划分规则控制种群中不同个体的数量以动态调控磷虾算法MBKH与黑洞算法BBHA的关系从而达到两个算法优势互补的目的。实验结果表明提出的混合磷虾黑洞算法IGMBKH-BBHA的收敛性和分类性能较单独磷虾算法和黑洞算法有一定的提高。然后测试并讨论了三种不同filter方法初始化MBKH-BBHA种群对算法性能的影响。最后通过对混合算法所选特征进行基因分析进一步验证了该方法筛选癌症生物标志物的性能。该方法在筛选癌症生物标志物中具有一定的参考意义,可以为相关研究者研究癌症与基因之间的关系提供新的有价值的信息。
其他文献
钢管混凝土结构由于具有承载力高、延性性能好、易于施工、耐火耐腐蚀、经济效益好等优点,在大跨桥梁、工厂和高层建筑等实际工程中均有较为广泛的应用。碳纤维增强复合材料(
群推荐系统已经成为社交网络平台的重要工具,该系统面向群体用户提供兼顾个性化和整体满意度的产品和服务。现有的群推荐方法大多是对个性化推荐方法的集成和聚合,但都忽略了
目前,智能手机等移动设备已经成为我们日常生活中使用最广泛的拍照设备。在使用移动设备进行拍照的时候,经常会遇到一些高动态范围的场景。在这种场景下拍摄所得到的图像往往
随着测序技术的不断发展,DNA测序技术在疾病预测和基因诊断方面的研究及应用变得越来越普遍。针对目前癌症病变高发的情况,引入DNA测序技术来帮助研究人员识别癌症标志物,对
随着全球经济一体化进程的加速,国内企业面临着复杂的外部环境。企业需要与不同的组织合作,互相传递消息,共享资源,共同应对环境的不确定性。董事会作为企业战略决策的主体,在战略性投资决策上发挥着巨大的作用。企业重大的投资决策需要很多的信息和资源,而企业可以通过连锁董事网络获取一定的外部信息和资源,为企业的战略性投资决策提供支持。在新形势下,如何有效利用连锁董事网络,进而提升企业的战略性资产,是企业面临的
锂电池作为新型能源电池因其优异的性能在电动自行车中得到了广泛的应用,其已经逐渐取代传统的铅酸电池成为电动自行车的动力源。然而,锂电池在工作过程中可能会遇到如下问题
混凝土材料依靠其优越的工程和力学性能,广泛的应用于建筑工程各领域。在各种类型的建筑结构中,混凝土结构占据着主导地位。但是,由于混凝土材料本身特性以及各种复杂环境等
在布雷顿森林体系下,现行国际金融组织的决策机制多为金融大国所控制。亚洲基础设施投资银行(以下简称亚投行)是首个由中国倡导建立,致力于促进发展中国家基础设施建设和经济互联互通的区域性金融组织。亚投行的决策机制能否体现广大发展中国家的利益是区别于同类国际金融组织的关键。本文通过对比同类国际金融组织在决策机制中的设计及其在实践运行中的缺陷,探究亚投行决策机制的合理性并提出完善意见。国际金融组织的决策机制
积雪是地球外部圈层水圈的地理要素之一,也是研究地球表层循环系统的重要要素之一。青藏高原作为世界第三极因其特殊的地理条件使其成为中国大陆主要积雪区之一,就全球尺度而
近年来,新闻文本自动化生成的应用越发普遍,其出现既带来了新的新闻创作模式,也影响了新闻读者的阅读体验。尽管机器生成新闻的影响已经得到学界的关注,目前仍缺少从语言学角