基于深度学习的癌症基因数据分类研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:kookzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量基因测序技术的快速发展和应用,使得个人基因测序成本大大降低。它为人类基于基因水平的癌症研究创造了先决条件。目前,信息智能化的进一步推进,使得人工智能已经在各个领域发挥着重要作用,尤其是在医疗健康领域,越来越多的研究者利用深度学习对基因测序数据进行分析。可用于辅助医生诊断癌症以及制定个性化治疗方案。基因表达水平上的癌症研究在很大程度上促进了癌症诊断和治疗技术的发展。本文利用深度学习算法对癌症基因组数据的分类模型进行研究与实现主要研究工作如下:1.本文改进了一种基于重构误差的深度信念网络深度自适应确定方法。让深度神经网络的深度确定不再完全依赖于人工设置,而是根据RBM的重构误差以及最深网络层数在模型训练过程中自适应确定,在一定程度上降低了人工网络层数设定的随机性。使模型在预训练过程能够自适应的确定一个较好的网络深度。2.本文提出了一种结合深度信念网络和LightGBM的癌症基因组数据分类模型。利用深度信念网络对癌症基因数据进行特征提取,代替了高成本的人工特征提取过程,用于LightGBM分类模型。在TCGA的拷贝数变异数据集上进行模型性能分析,实验结果表明,利用深度信念网络五折提取的特征能提升模型性能。3.本文以深度信念网络模型为基础,提出了一种基于多模态数据的乳腺癌相关蛋白质分类模型。该方法通过设计三个深度神经网络,分别提取了DNA甲基化、基因表达以及miRNA表达数据中包含的乳腺癌亚型蛋白质的分类特征,对单模型深度信念网络的输出建立浅层神经网络,进行后端决策融合。在TCGA-BRCA数据集上的实验结果表明,融合多模态数据的深度学习模型在多个性能评估指标上优于单模态模型和传统分类模型。本文利用深度学习算法对癌症基因组数据进行研究,着重于癌症分类以及乳腺癌亚型相关蛋白质状态分类的研究,为癌症诊断和治疗提供参考,辅助医生为患者制定个性化治疗方案,提高癌症患者的治愈率。
其他文献
AICPA职业行为守则的演变历史昭示:会计职业道德守则的制定理念从职业成立初期的"品性至上、限制成文规则",发展到现在的"详细具体的技术规则",而国际会计师道德准则委员会最
鸦片战争后,以清廷为中心的不平等条约体系逐步形成,作为总理各国事务大臣的奕劻在其中扮演了重要角色。中葡交涉期间,奕劻试图在澳门设关立司以遏止走私,却间接承认了葡萄牙
目的探讨抑郁障碍相关性失眠临床证候要素(简称"证素")的分布及其病机。方法通过对56例抑郁障碍相关性失眠临床资料进行证素的整理和提取,并应用频数统计等方法进行分析。结
<正> 1985年11月至1989年3月,笔者用人参蛤蚧散加味治疗30例咳喘患者,近期疗效满意,现报道如下。一、临床资料:30例均经西医诊断为慢性支气管炎或肺气肿、肺心病。其中男27例
目的探讨产程潜伏期延长的发病因素、预后及处理方法。方法收集2008年1-6月洛阳市妇女儿童医疗保健中心足月单胎头位初产妇符合潜伏期延长诊断者59例(观察组),与同期足月单胎
伴随着中国市场经济体制的不断完善以及近年来世界金融危机的冲击,社会经济环境变换莫测,而这一系列不确定因素对于我国以家族企业为代表的广大中小企业来说,往往会成为严重
兽用抗生素作为饲料添加剂被广泛地应用于养殖业中,进而不断被引入土壤环境,其造成的假持久性污染效应及其所引起的潜在环境毒性效应均引起了社会的广泛关注。本文以我国使用
通过在实验室采用水针法对交联聚乙烯绝缘块进行水树枝的培养,重点研究了施加的交流电压、试验时间、频率以及针尖曲率半径对水树枝生长的影响。并通过数学分析验证试验结果,
<正>"酸和碱的反应"是粤教版九年级化学中的重难点知识,也是各省市中考的热点考点。教材将其设置在第八章"常见的酸、碱、盐"第三节,教材在前面两节已经对溶液酸碱性、常见的
<正>民营企业已成为我国经济增长的中流砥柱,企业文化与慈善文化的交融势在必行,企业慈善文化是一种先进文化,引领和促进企业凝聚核心竞争力,在这种背景下,一个企业获得了文