论文部分内容阅读
基因组是一个复杂系统,基因间通过复杂的相互作用方式形成网络,来实现生物体的功能。如何从海量的数据中准确有效地获得基因间相互作用的信息,构建合适的形式化模型,研究分析基因间的关系并从中发现生物学规律,是后基因组时代的重要课题。本文基于基因表达谱数据,对脑瘤和肾癌形成和发展的相继故障机理进行了探索和研究,具体内容如下: 1、基于正常脑组织和神经胶质瘤II期、III期、IV期以及正常肾组织和肾癌I期、II期、III期的基因表达谱数据,构建相应的基因互信息网络。根据基因间互信息与距离的负相关关系,将互信息网络转化为基因负荷传播网络。建立以介数为负荷—容量的基因负荷传播网络模型,分析了网络的相继故障传播机理。通过比对相继故障结点百分比、平均故障规模、平均故障影响力和平均故障规模累积概率这四个衡量网络鲁棒性的结构参数,发现正常脑组织和神经胶质瘤基因网络之间以及正常肾组织和肾癌基因网络之间都具有明显的结构差异性。在这两个实例中,正常对照组网络都比实验组网络更易发生相继故障,这表明实验组网络有较强的鲁棒性。进一步地,根据基因在不同网络中产生的故障规模和故障影响力,分别得到47个神经胶质瘤相关基因和39个肾癌相关基因。已有文献表明:基因 APOC1、CAMK2B、EZH2、ID3、LG1-3、MELK、NBN、Ndc80与神经胶质瘤的发生发展有密切关系,基因SLC12A3、SLC22A7在肾细胞中有重要作用,DACH1、NFKB1与肾癌的发生发展有密切关系,基因ELF5是一个肾癌抑癌基因。我们预测其他的结构性关键基因可能对神经胶质瘤或肾癌的发生发展或转移起重要作用,这些预测的基因为研究神经胶质瘤和肾癌相关基因提供了新的方向。 2、基因只是遗传信息的载体,要研究生命现象,阐释生命活动的规律,不能仅仅局限在基因组的结构上。基因通过RNA翻译成蛋白质,蛋白质才是生命活动的直接执行者。因此,对于蛋白质的数量、结构、性质、相互关系和生物学功能进行全面和深入的研究,可以启示我们从一个全新角度去研究肿瘤的发病机理。在文献[80]的基础上,根据蛋白质复合体与基因间的关联关系和基因紧密度的定义,建立蛋白质复合体相互作用网络。将蛋白质复合体相互作用网络转化为负荷传播网络,用以介数为负荷—容量的负荷传播网络模型分析了网络的相继故障传播机理。通过比对相继故障结点百分比、平均故障规模、平均故障影响力和平均故障规模累积概率这四个衡量网络鲁棒性的结构参数,发现正常脑组织和神经胶质瘤的蛋白质复合体网络之间以及正常肾组织和肾癌的蛋白质复合体网络之间没有明显的结构差异性。根据已发掘的神经胶质瘤和肾癌相关基因以及本文得到的结构性关键基因,发现基因模式与其关联的复合体模式相吻合。分析了关联的蛋白质复合体的功能:神经胶质瘤原癌基因MYC关联的复合体c-Myc是细胞生长—致癌转换辅因子。肾癌抑癌基因PBRM1关联的复合体SWI/SNF可以抑制多种肿瘤的生长。