论文部分内容阅读
文章主要从以下几个部分进行论述: 第一部分 对人肺腺癌中无义介导降解机制个体差异的探究 作为一种RNA监督机制,无义介导降解通路在正常的生命过程中发挥着重要的功能。除了降解含有提前终止密码子的mRNA,阻止其产生截短的蛋白之外,该机制还可以偶联剪切过程,通过可变剪切,调节基因的表达量。据估计细胞内大约有三分之一的可变转录本含有提前终止密码子,并可能是该机制的靶标。在营养缺乏、缺氧等情况下,该机制会受到一定的抑制,无法发挥其在正常的生理状况下的调节功能。那么该机制在肿瘤中是否正常呢?事实上,目前的研究在该问题上并没有给出一个明确的答案。一方面,肿瘤微环境,比如氨基酸缺乏、缺氧和活性氧以及NMD核心因子的突变都能够抑制NMD机制的活性。另一方面,Fernando Pastor等人反而提出利用抑制NMD来使得肿瘤产生能够被识别的抗原,进而激发免疫反应来抑制肿瘤的治疗办法。 为了较为全面地了解NMD在肿瘤中的活性状况,在本实验中,我们使用了韩国72个肺腺癌病人的癌症和相应癌旁组织的RNA-seq数据。通过对NMD转录本和无义杂合SNVs的分析,我们发现该机制在肺腺癌中是发挥功能的。由于基于NMD的治疗并没有考虑到个体之间的差异性,因此我们接下来从基因表达,可变剪切和无义杂合SNVs三个方面来衡量NMD活性在病人之间的变化。前两个方面的结果有良好的相关,显示大部分病人的NMD活性都差别不大,只少数病人较高或者较低。第三个方法由于找到的无义杂合SNVs较少等原因而没有显著相关。因此从NMD活性差异的角度来说,通过抑制NMD来治疗肿瘤的方法可能是可行的。最后,我们还发现肿瘤中NMD核心因子的表达也有一定不同,说明肺腺癌组织可能在不改变其活性的情况下,对该机制进行了某些修改。 第二部分 基于成组反相蛋白数据归类十种癌症类型 随着大批量癌症基因组数据的出现,更高效和自动化地归类癌症类型,如用少数基因尽可能地区分不同类型的癌症变得日益重要。由于蛋白表达要比基因表达更加地稳定,因此我们选择成组反相蛋白分析(reverse phase proteinarray,RPPA),这个以抗体为基础的靶向蛋白组高通量途径用于研究。本次研究中我们针对RPPA数据,使用SMO(Sequential minimal optimization)方法,提出一个计算框架将病人样本归类到十种主要的癌症中。针对训练集的187个蛋白,使用mRMR(minimum Redundancy Maximum Relevance Feature election)和IFS(Incremental Feature Selection)方法,23种重要蛋白被选择出来。使用这23种蛋白,在训练集中,我们成功地归类了十种类型的癌症,采用10折交叉验证,训练集的MCC值为0.904,独立测试集的MCC值为0.936。接下来,我们进一步分析了23种蛋白。这些蛋白中的大多数为癌症的标志性蛋白。例如,Chk2在癌细胞的增值中,起到重要的作用。对这23种蛋白的进一步分析,进一步提示我们这些蛋白可作为癌症分类的重要指示。希望我们的方法能够在不同种癌症的生物标记发现上有所启示。