乳腺癌基因组数据分析与生存期预测研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:simetl21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种高发病率、高致死率的恶性疾病,乳腺癌严重危害女性健康。在亚洲女性易患恶性肿瘤中,乳腺癌的发病率位居前列。随着人口数量增加、人口老龄化以及包括烟草、肥胖和感染疾病等高风险因素的蔓延,乳腺癌患病人数和死亡人数逐年增加。近年来,随着现代医学的持续努力与进展,新的诊断策略与方法得到广泛应用,乳腺癌的诊断也更加完善,乳腺癌的死亡率已有所下降。然而,乳腺癌的高发病率和高死亡率仍然是一个不容忽视的严峻问题,筛选与乳腺癌的发生、发展和预后有关的潜在生物标志物,以及揭示与乳腺癌相关的生理和病理过程仍显得尤为重要。同时,鉴于乳腺癌的高致死率,有必要对癌症患者的生存期进行相对准确的预测,从而为患者提供更加精确的照顾和治疗,提高癌症患者的生存质量。作为传递遗传信息的重要物质,基因控制遗传性状的表达,参与人体代谢的全部过程,并调节人体代谢活性。传统的研究和诊断仅仅能反映患者的外部症状,而对癌症患者基因表达状况的研究则能发现相关基因的功能和pathway生物通路。因此,挑选与乳腺癌有着较强关联性的关键基因,用于预测乳腺癌的发病因素,可以降低癌症发展和转移的风险;通过对癌症患者生存期进行预测,可以为患者提供更有效的个性化治疗,从而降低乳腺癌死亡率并提高长期生存率。本文首先探讨乳腺癌的发病机制以及确定诊断和治疗的关键候选基因,对乳腺癌患者基因组学数据进行了特定基因标志物分析。鉴于基因表达数据“高维数、小样本、有噪音”的特点,选用差异表达基因分析对癌症基因进行初步过滤,并选用支持向量机-递归特征消除法(SVM-RFE)对特征进行进一步筛选。进而通过蛋白相互作用网络(PPI)选取关键基因,并对关键基因进行生存分析,初步探测潜在乳腺癌生物标志物。接下来,针对大量基因参与的多种pathway生物通路进行特征提取,提出了一种新型的pathway生物通路特征提取模型ADS(autoencoder-shapley)。ADS将参与某一pathway生物通路的多个基因融合成一个新特征,并用此新特征来代表该pathway生物通路。然后,让新特征经过神经网络(NN),对特征的分类贡献度进行shapley打分,进而得到更有意义的pathway生物通路。最后,基于候选基因标志物集合,本文对乳腺癌患者的生存期进行预测研究。提出一种新型融合预测模型FSNX(RF+SVM+NN+XGBoost),该模型融合了随机森林(RF)、支持向量机(SVM)和神经网络(NN)等分类模型的优势,将多种预测模型的预测概率值作为新特征,通过XGBoost方法进一步提高患者生存期预测效果。经实验测试,FSNX方法的效果优于单独预测模型和多种最新模型的预测效果,3年期生存期预测准确度可达86.81%。同时,本文针对FSNX方法开发了相应的应用程序,用于辅助医生预测乳腺癌患者生存期,帮助医生为患者提供更有效的个性化治疗方案。
其他文献
多智能体系统对解决分布式问题具有灵活性和智能性的特点,并且在仓库管理、自治交通工具、机器人、物流交付等多个领域有着广泛应用。多智能体路径规划是多智能体系统的核心问题,研究多智能体路径规划问题,可以提高多智能体系统的运行效率,同时对多智能体系统所应用的领域的发展有着深远影响和积极意义。虽然目前的多智能体路径规划方法已经取得不错的成果,然而,由于规划空间过于复杂,现有的方法将规划空间采样成为参考点或者
学位
赶黄草(Penthorum chinense Pursh),又名扯根菜,是虎耳草科扯根菜属植物,其富含黄酮类、萜类、多酚类、木脂素类、有机酸类等活性成分。现代药理学研究表明,赶黄草具有抗氧化、护肝利胆、抗病毒、抗肿瘤、抗炎、降血脂等多种生物活性。目前鲜有针对赶黄草不同地上部分的活性物质的对比研究,因此本文以赶黄草花总黄酮(H-Fla)、赶黄草叶总黄酮(Y-Fla)为研究对象,对其进行了提取工艺优化
学位
RNA结合蛋白(RNA-binding proteins,RBPs)是一类与RNA调节和代谢相关的蛋白质,在RNA成熟、转运、定位和翻译过程中起着重要作用。然而,生物实验性的全基因组RNA结合检测方法成本高且耗时。因此,迫切需要一种高效、快速的方法来利用从现有标注知识中学习到序列模式来预测RBP结合位点。由于紫外交联免疫沉淀结合高通量测序(CLIP-seq)的快速发展,积累了大量关于RNA分子与R
学位
单氯丙醇酯(monochloropropandiol esters,MCPDE)包括3-氯丙醇酯(3-monochloropropandiol esters,3-MCPDE)和2-氯丙醇酯(2-monochloropropandiol esters,2-MCPDE),与缩水甘油酯(glycidyl esters,GE)类物质是动植物油脂高热加工和食品烘焙、煎炸等热加工过程中常见有害物质。烘焙食品加
学位
菠萝作为世界著名的热带水果,被广泛应用于日常消费和深加工,但在这些过程中会产生大量的废弃余渣,如果不加以合理利用,会造成资源浪费和环境污染。然而,对于菠萝余渣纤维素进行高值化利用的相关报道较少。纤维素作为自然界中最丰富的一种多糖,约占菠萝加工余渣比重的40%,具有较大的提取和利用价值。纤维素纳米晶作为纤维素的衍生物,表现出极佳的力学性能、阻隔性能、表面活性和无毒性,在聚合物材料领域具有广泛的应用前
学位
机器人广泛应用于现代工业社会的各个领域,其中多模块机器人因其优秀的多任务多地形复杂场景适应性而受到广泛关注。多模块机器人的优势主要来自于其构型可以自由变化以及灵活的运动方式,研究者们通过良好的重构规划策略实现这些优势,而重构规划的关键技术包括构型选择和运动规划。另外,多模块机器人的各个模块都有着相对独立的感知能力和运动能力,在复杂地形场景下完成各类任务的过程中,规划策略应该在一定程度上保证其各个模
学位
强化学习是机器学习领域一种非常成功的学习范式,如今在实际应用中体现出来巨大的价值,如棋类与游戏博弈、机器人控制、自动驾驶、生物制药等。值方法和策略优化是强化学习的两种主要方法。通用函数近似和自博弈训练范式的结合在值方法强化学习方面取得了巨大的成功。然而,这种组合的理论保证,如样本复杂度的上界,仍然尚不完整。另外,为了更好地理解策略优化算法及其学习理论,策略优化被发现可以看作是概率测度空间中的最优传
学位
利用脂肪酸脱羧制备烃类生物燃料是开发可再生能源的有效途径。相比于传统化学方法,生物酶法具备高效、低能耗及环境友好等优势,更具有工业化应用前景。光脱羧酶(Fatty acid photodecarboxylase,FAP)是一类专一性强、催化效率高、催化过程无需额外添加昂贵辅因子,仅需利用蓝光即可将脂肪酸转化为烷(烯)烃的光驱动酶,在烃类生物燃料的高效可持续生物合成领域具有显著应用潜能。目前仅有偏好
学位
知识抽取是构建知识图谱的关键步骤,其研究难点在于理解无结构化的自然语言文本,从中抽取出结构化的关系三元组知识。然而,现有知识抽取方法难以解决复杂语义环境下的关系重叠问题,导致在实际应用中有许多不足之处。为了解决上述问题,本文以一种全新视角来重新审视经典的关系三元组抽取任务。通过对关系三元组的数据似然进行原理性推导,首次提出将关系建模为从主语实体映射到宾语实体的函数,并基于预训练语言模型BERT实现
学位
刺梨(Rosa roxburghii Tratt)是属于蔷薇科蔷薇属的落叶丛生灌木,主要生长于我国西南海拔500~2500米的山区。刺梨的果实是一种极具地域特色的水果,富含多酚、多糖、有机酸、氨基酸和三萜类物质等活性成分,具有抗氧化、抗癌、降血糖、抗动脉粥样硬化、抗衰老等活性。刺梨果渣作为刺梨加工产业的副产物,富含多酚类物质,尤其是所含的黄酮类化合物占刺梨全果黄酮的80%。目前对刺梨的研究主要集中
学位