改良交叉验证的遗传算法优化的神经网络研究

来源 :哈尔滨医科大学 | 被引量 : 0次 | 上传用户:gerui1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:在多分类的高维基因表达谱数据的处理与分析中,探讨特征基因的筛选方法,通过构建基于交叉验证的BP神经网络进行分类预测,为高维组学数据的方法学研究和BP神经网络的实际应用提供科学依据。   方法:本研究利用Khan等人收集的83个样本6567个基因的小圆蓝细胞瘤基因表达谱数据进行研究,根据高维组学数据的特点,采用统计学和计算机相结合的技术,参考Golub等人对二分类数据的特征基因筛选方法,通过计算每个基因的PS值,对本研究中的四分类问题进行特征基因的筛选;构建基于交叉验证的BP神经网络,利用遗传算法对网络进行优化,并提出了改良的交叉验证算法,对比改良前后的分类效果差异。   结果:通过计算每个基因的PS值,共获得144个特征基因,与Khan等人基于3750个线性神经网络所筛选的96个特征基因吻合上了20个。在构建BP神经网络的过程中,将83个样本分成两部分,其中63个样本用于网络的训练过程,另外20个不参与训练而作为独立样本集用于后期的外部验证,因Khan等人所建立的96个特征基因的线性神经网络对83个样本的的亚型分类完全正确,因此,本研究也利用他们所选择的96个特征基因,通过10次和20次的3倍交叉验证过程,得到网络的内部验证和外部验证的正确率至少都超过了85%,说明所构建的网络具有较好的应用价值;然后,针对利用PS法所选择的144个特征基因,分别进行10次改良和270次未改良的3倍交叉验证过程,各自产生810个分类器,改良前内部验证的整体正确率和外部验证的正确率分别为97.19%和85.78%,改良后的分别为95.22%和76.86%。   结论:本研究所提出的多分类数据特征基因筛选的PS算法,计算简便且效果良好,利于操作和实现,为基因表达谱数据的降维提供了新的思路;BP神经网络与线性神经网络相比有其优势,但在特征基因筛选结果很理想的情况下,其优势并不明显,且线性神经网络构建得好其预测效果也会足够良好;遗传算法可以用来优化BP神经网络,算法中参数的设置可直接影响到优化效果,对于高维数据来说该方法的优化过程更为复杂;改良的交叉验证算法可保证有更为充足的分类信息,但如何能够实现真正意义上的“改良”,还有待于进一步完善方法。
其他文献
目的:餐后高血糖症(Isolated Post-challenge hyperglycaemia,IPH)是2型糖尿病(Type2 diabetes mellitus,T2DM)的一种类型,主要表现为空腹血糖正常(空腹血糖
1815年,安德鲁·杰克逊被任命为美国海军部队的将军,因为他长得瘦小,所以很多水兵都不服他。有一天,几个水兵看杰克逊来到甲板上,就想让他当众出出丑,于是有个水兵故意大声说
期刊
目的:探求妊娠期高血压疾病(HDCP)对患者学龄前期子代在体格及神经心理发育方面的影响。   方法:采用1:1配对的病例对照研究方法,随访HDCP患者子代27人,对照27人。通过自
目的:β-紫罗兰酮是广泛存在于天然食物中的一种类异戊二烯单体成分,具有诸多的生物活性,以抑制肿瘤作用的研究最为广泛和深入。本研究以乳腺癌为研究对象,着重研究其对于乳腺癌
磁选仅适用于含铁的物料,这是一个一般的错误概念。事实上,多数的物质,甚至液体和气体都可以磁选,在许多情况下,磁选技术可以代替其它的选矿方法。目前,随着一些原料的贫化
2005年,第一炼钢厂党委在开展“四好”班子创建活动中,把党风廉政建设作为重点,抓反腐倡廉理论学习、抓党风责任制落实、抓廉政制度建设、抓党风廉政监督、抓廉政文化的创建,
郭健锋号山人,室名寒香斋。1979年出生于景德镇浮梁高岭,毕业于景德镇陶瓷工艺美术学院,而后又就读于景德镇陶瓷学院美术系。现为景德镇现代陶瓷艺术研究所画师,寒香斋艺术
一、研究背景   众所周知,最大限度地提高耐力运动能力对于军人、运动员等特殊群体来说具有极其重要的意义。而铁稳态与耐力运动能力密切相关。因此,铁缺乏和铁过负荷除了关
国有国法,党有党章。党章是规范和制约全党行为的总章程。一个政党能否有效地贯彻和遵守自己的章程,是直接关系其生存发展的根本大计。对我们这样一个拥有7080万党员的大党来
目的:镍生物学作用的第一个实验观察报告是Tubingen大学GmelinCG教授1826年发表的。某些化学形态的镍可使肺癌和鼻癌增多的第一个信息来自威尔士Clydach镍精炼工厂,我国镍矿开