基于智能算法的高维生物医学数据集的特征选择策略研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:doodoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因芯片技术在医学领域被广泛应用,大量微阵列数据被迅速积累,通过对这些数据进行分析并构建有效的分类模型,对一些潜在病患的早期诊断和临床治疗具有重要的研究意义和应用价值。然而,基因微阵列数据具有“高维小样本”的特点,如结肠微阵列数据集包含了两千多个基因特征。面对如此大规模的微阵列数据集,专家在短时间内不能直接进行分析和诊断治疗。此外,大多基因数据通常含有一些冗余或噪声数据,可能会导致疾病诊断算法的建模和训练时间过长时的过度拟合而误导,从而导致错误的医疗诊断。作为一种有效的降维方式,特征选择在生物医学领域已经引起广泛的关注并成为近年来生物信息学领域的研究热点。特征选择技术是对微阵列基因数据进行适当分析和分类的关键步骤,如果没有合适的特征选择方法,现有的模型很难准确捕获重要信息。本质上,特征选择问题可以被视为一个双目标优化问题,即在保持或提高预测精度的同时优化特征子集。目前已经存在一些针对微阵列生物医学数据的特征选择方法。其中,基于Wrapper的特征选择方法在搜索过程中旨在获得较高的分类精度而吸引了越来越多研究学者的注意。搜索策略是Wrapper方法中最重要的步骤,基于种群机制的元启发式搜索通常用于Wrapper方法寻找最佳特征子集提高分类性能。本文从提高Wrapper方法的搜索性能入手通过对不同类型的智能算法进行改进来对高维生物医学数据集进行特征选择。主要研究如下:1、提出了一种基于改进克隆花授粉的特征选择策略(IBCFPA)。克隆花授粉算法CFPA是通过Levy飞行公式和自花授粉交替来更新解。为了进一步提高CFPA的搜索性能,引入绝对平衡分组策略,将克隆花授粉算法搜索出的当前最优解进行克隆操作形成新的种群并分组,首先进行组内的局部更新,再进行组间的全局更新。通过自适应高斯突变操作来改善当前最优解,设置一个监管机制来判断搜索到的最优解是否陷入局部最优。实验结果表明,与其他智能算法相比,该方法IBCFPA可以高效选出最佳的特征基因获得更高的分类精确度。2、提出了一种基于改进珊瑚礁优化算法的特征选择策略(BCROSAT)。珊瑚礁优化算法CRO是通过模拟珊瑚礁幼虫的繁殖和进化过程更新个体的群体智能算法。在初始化过程将每个珊瑚幼虫模拟成一个二维向量,构建珊瑚初始种群。通过锦标赛选择策略从所有珊瑚虫中按一定的概率选择一个解来替换初始种群中最差解,不仅增强初始化种群的多样性,而且提高了初始解的质量。为了增强CRO算法的局部搜索能力,将模拟退火算法SA作为CRO算法的局部搜索算子。实验结果表明,BCROSAT算法的搜索性能优于IGA和MPSO等。为了验证BCROSAT算法的性能,使用不同的分类算法KNN,SVM和ELM结合10-折交叉验证来评估该算法的分类精确度。3、提出了基于增强的Wrapper模式的特征选择策略。鉴于Filter方法能够高效地对高维数据进行过滤,提出结合Filter和Wrapper模式的特征选择策略以提高分类的性能。在对基于花授粉算法和珊瑚礁算法的特征选择研究基础上,进一步结合卡方检测,分别提出了基于卡方和花授粉的特征选择策略Chi-IBCFPA和基于卡方和珊瑚礁的特征选择策略Chi-BCROSAT。在初始化过程构建双种群初始化策略,将一部分初始种群个体通过卡方检测来进行预处理,另一部分种群个体通过随机初始化设置。实验结果表明,提出的结合算法Chi-IBCFPA和Chi-BCROSAT的性能明显优于近年来提出混合模式IGGA和IG-PSO,结合后的Wrapper算法能够更高效的搜索出最佳特征子集达到较优的分类性能。
其他文献
背景:脑血管病(cerebrovascular disease,CVD)为临床神经内科多见的一类严重疾病,其发病人数与致残人数均居高不下。其中,缺血性脑血管病(ischemic cerebrovascular disease,
邵经明教授,我国著名的针灸专家,首批国家级名老中医。邵老从医80余载,尤精针灸,他研创的"三穴五针一火罐法"治疗哮喘,独树一帜,疗效非凡。临证时强调取穴精简,针刺手法因人
当下互联网技术飞速发展,海量的信息资源使得网络利用率急剧下降,所以,如何快速为用户推荐出满足其需求条件的信息,并提高推荐系统的个性化和推荐效果的准确性,成为目前尤为突出的待解决研究点。本文针对推荐系统的个性化服务效果和推荐结果的准确度提升等,改进了传统推荐算法,并将深度学习技术与推荐系统相结合,融入到了多Agent推荐框架之中,以此展开深入的研究。本文的主要研究内容如下:(1)针对传统基于协同过滤
通过对典型路面实车试验获得的载荷数据进行处理,利用雨流计数法编制了传动系统的载荷谱。通过应力、强度干涉模型建立该底盘侧减速器可靠度的计算模型,然后利用接触强度寿命
随着旅游业的迅猛发展和市场竞争的影响,生态旅游形象设计越来越受到重视。论文中作者分析了黑龙江省生态旅游形象设计的自然、区位、市场因素,并进一步设计了总体形象,同时
目的:观察巨噬细胞炎性蛋白-1β(MIP-1β/CCL4)在病毒性心肌炎小鼠血清以及心肌组织中的变化,初步探讨CCL4在病毒性心肌炎中发挥的作用。方法:雄性Balb/c小鼠随机分成对照组1
草莓(Fragaria ananassa Duchesne)香气浓郁,酸甜宜人,倍受广大消费者的喜爱,是重要的经济果树。由于草莓品种繁多且表型相似,难以靠肉眼区分,加大了培育优质草莓的难度,需借
本文基于天津市滨海新区A07地块项目深基坑工程,首先研究了规则形状的深基坑环梁和直梁的支撑效果,发现环梁支撑结构在基坑开挖支护中的效果明显优于直梁支撑结构.其次,以有限元A
作为一名中国知名的当代艺术家,蔡国强凭借其独特的"火药艺术"在世界艺术之林中闯出了一片天地,但作为一位有其独立思想的艺术家,他的创作之路并没有被"火药"所局限,而是具有
企业年金基金所具有的规模性、长期性等特性以及其所追求的养老金安全、收益稳定的价值目标与信托制度所特有的财产之独立性、管理之连续性以及“避税管道”、“专家理财”等功能具有天然契合性。因此,当今世界多数国家(如美国、澳大利亚、智利等)采用信托模式来运营和管理企业年金,以此提升企业年金的运作效率与收益。我国亦采用信托模式来运作企业年金,但是信托运作的实际效果不尽如人意。受托人是企业年金信托法律关系的必要