基于多组学数据的乳腺癌复发转移风险预测

被引量 : 0次 | 上传用户:GoAndSeek
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌是严重威胁女性健康的恶性肿瘤,其术后复发和转移是导致乳腺癌患者死亡的主要原因,预测个体复发(转移)风险对于辅助医生精准治疗的进一步发展有重要意义。随着生物医学基础研究的深入,最大化融合临床和组学数据以便提供更为全面的患者信息以及优化疾病的诊断模型迫在眉睫。本文主要先通过Micro RNA(miRNA)构建分类模型;其次,为了提高模型的精度,使实验具有普遍性,我们提出了一种新的多模态深度学习的研究方法,通过整合病理学图像(H&E)、临床数据和测序数据建立预测模型,以评估乳腺癌患者复发和转移的风险。基于miRNA的分类预测模型,研究目的是比较几种分子生物标志物(如miRNA、lnc RNA、m RNA和CNV)在预测乳腺癌复发和转移风险中的作用。首先,从TCGA中下载483名乳腺癌患者的分子数据,将其按7:3的比例随机分为训练集和测试集;其次通过方差分析对大维度的数据特征选择,最终选择出15种基因标志物作为模型的输入数据;随后利用Sklearn库中常见的几种机器学习模型(例如随机森林、逻辑回归、支持向量机等)构建分类器,并通过训练模型做出最终预测,其受试者工作特征曲线下面积(AUC)值为0.70;通过将模型的结果与其他组学数据所构建的模型进行对比,说明miRNA数据对于乳腺癌复发和转移有更高的敏感度。对于多模态深度学习的研究方法,我们将这种方法称之为ICSDA。具体来说,我们自动识别H&E图像的肿瘤区域并分割为256×256像素大小的图像块集合;通过深度神经网络将每个图像块编码成一维的特征向量;然后注意力模块对H&E的每个区域评分,并将其与临床数据和分子测序数据结合;基于组合的特征,构建了一个多模态的模型来预测每个患者复发和转移的风险。该模型在我们的测试集上实现了0.75的曲线下面积(AUC)。基于医学图像和分子测序技术的癌症预后的研究有助于识别复发和转移的高风险癌症患者,为术后辅助治疗提供有效指导。最后,将我们所提出的模型和算法做了一个详细的总结,并针对我们模型中存在的不足之处提出可行性的解决办法,同时还展望了后续的研究。
其他文献
为深入了解猪乳中蛋白质的组成及其变化规律,对采自四川西昌的大约克猪(n=32)共50个乳样中的蛋白质组成和含量、3种蛋白质遗传多态性进行了分析,并对乳中一种高分子量蛋白(HMWP)进行了初步纯化和鉴定。主要内容和结果如下:(1)对大约克猪的初乳、常乳进行了研究,结果表明:泌乳第1天(D1)乳中蛋白质含量最高;SDS-PAGE在乳中检测到酪蛋白、免疫球蛋白、β-乳球蛋白、α-乳清蛋白、乳清酸蛋白和高
学位
遗传多样性是动物进化的基础,对物种的生存、适应和进化具有重要影响。种群的遗传多样性水平越高,种群就越容易在复杂的环境中生存。因此遗传多样性水平反应了一个物种或种群对环境的适应能力。扩散是指在一定选择压力下,物种从出生地向其他地区迁移的行为,是动物整个生活史中最重要的行为之一。在扩散时,个体可能会付出死亡和未知栖息地的代价,同时也会获得避免近交和更多繁殖机会的利益。当代价和利益不平衡时,自然选择会促
学位
本论文以哈贝马斯的交往行为理论为研究对象,对该理论产生的社会历史背景及理论渊源作了梳理,接着从文学本位出发,分析了该理论中最重要的三个概念(主体间性、交往行为、生活世界)对诗学的启示作用。哈贝马斯交往行为理论与战后德国的社会历史环境关系密切。二战后联邦德国在经济上实现了快速发展;在政治上各种政治力量激烈交锋,又维持了整体政局稳定;在文化上,则背上了发动战争和屠杀的精神负担。哈贝马斯在这种社会语境开
学位
牦牛是青藏高原地区的特色畜种,牦牛乳营养丰富而产量较低,但牦牛与普通牛的杂交后代(犏牛)产乳量显著提高。本研究在四川省红原县采集牦牛乳样68份和犏牛乳样41份,比较两种乳的生化成分差异和β-酪蛋白基因型,探索犏牛产乳量提高的分子基础,并建立快速鉴别牦牛乳掺入普通牛乳的方法,为牦牛和犏牛乳品质的研究和监测提供帮助。主要研究内容和结果如下:(1)测定牦牛和犏牛日挤乳量、常规乳成分和乳蛋白质的组成。结果
学位
本文在抗菌肽Tachyplesin Ⅰ(TP Ⅰ)的分子结构特征基础上,以提高TP Ⅰ抗菌活性的同时降低其溶血性为目的,通过生物信息学软件开展设计,改变了母肽TP Ⅰ的结构参数,合成了一种新型抗菌肽TP Ⅰ-Y4,并研究了TP Ⅰ和TP Ⅰ-Y4的构效关系与抑菌机制。具体包括以下几个方面:TP Ⅰ-Y4是保持TP Ⅰ的肽链长度与电荷数不变,将形成二硫键的四个半胱氨酸用芳香族氨基酸酪氨酸替换。经过生
学位
牦牛是青藏高原及其毗邻地区特有牛种,是高原畜牧业最重要的优势畜种,对我国西部地区经济发展具有重要意义。肌原纤维蛋白(myofibrillar protein,MP)是影响肉嫩度和保水性的重要结构蛋白,决定了肉制品的质构、风味和加工特性。但是,一些天然蛋白质由于易受切碎、腌制、烹饪等加工过程中产生的微环境变化的影响,很少表现出能很好地满足食品工业各种需求的理想功能特性。大蒜作为人们日常生活中常用的香
学位
β防御素广泛分布在植物、哺乳动物和昆虫中,是机体抗感染中第一道防线粘膜的关键因子。为了深入研究牦牛β防御素124(Beta-defensin124,DEFB124)和β防御素127(Beta-defensin127,DEFB127)的基因结构特点、蛋白特性及免疫功能,采用PCR扩增、原核表达、苏木精-伊红染色、阿利新蓝染色、透射电镜、肠道微生物测序、免疫组化和免疫荧光等方法进行研究。结果表明:牦牛
学位
目的:对羊源菌株XM06进行鉴定并探究其致病分子机制。方法:采用马铃薯葡萄糖琼脂培养基(PDA)培养、乳酸酚棉蓝染色、扫描电镜和ITS基因对菌株XM06进行分离和鉴定。通过血清生化指标、组织真菌负荷测定、HE染色、Masson染色、透射电镜、RT-q PCR、免疫荧光和转录组测序等方法探究构巢曲霉菌株XM06对小鼠的致病性及致病机制。结果:菌株XM06在PDA上呈暗绿色,边缘白色绒毛,中心粉末状。
学位
黄牛作为我国重要的经济型家畜之一,在国内的饲养量居畜牛类首位,具有良好的环境适应性和疾病抗性,包含丰富的遗传资源和广泛的基因库。而肺脏作为黄牛的重要功能器官,除了极为重要的呼吸作用以外,还承担着调节机体水液的运输、排泄、免疫和造血功能。但由于肺脏特殊的生理结构和功能,其在呼吸过程中更容易受外界有害因素的影响,是最容易得病的器官。近年来,随着单细胞测序的快速发展,单细胞转录组测序已被广泛应用于不同科
学位
丁自申,字朋岳,号槐江,是明代中期福建泉州散文家,历经嘉靖、隆庆、万历三朝,历任南京工部营缮司主事、四川顺庆知府以及广西梧州知府。为人刚正不阿,清正廉洁。其在散文创作上数量颇多,世人评价也颇高。本文通过参考有关方志文献与他人相关文集所载,对丁自申的生平事迹、交游情况进行考述。对丁自申散文的主要内容、创作特色、创作成因、散文地位及价值进行探究,以期将来能够进一步对其人其文进行深入研究。丁自申所作散文
学位