论文部分内容阅读
如何从海量的数据中准确有效地获得基因间相互作用的信息,构建合适的形式化模型,研究分析基因间的关系并从中发现生物学规律,是后基因组时代的重要课题。本文基于基因表达谱数据,对肺癌和Parkinson疾病的内在机理进行了探讨,具体内容如下:1、利用肺组织在正常和癌症不同分型—腺癌(AC)和小细胞肺癌(SCLC)的基因表达谱数据,构建相应的基因相关网络。通过比对这些网络的结构参数,发现正常和肺癌的基因网络结构具有明显的差异。进一步地,根据每个基因在不同网络中的度、介数和核数的差异,得到9个结构性关键基因,其中7个基因有文献支持与肺癌相关。我们预测另外两个基因AKT1和REL可能对肺癌的发生发展或转移起重要作用。构建正常和肺癌不同分型的基因逻辑网络。比对这些基因逻辑网络中的二阶逻辑类型分布,发现正常基因逻辑网络中,包括逻辑类型1,3,5,8,而在AC和SCLC网络中,逻辑类型8均没有出现,逻辑类型5在AC基因逻辑网络中没有出现,而逻辑类型2,6和2,4,6分别出现在AC和SCLC基因逻辑网络中。根据系统结构决定功能的基本原理,上述正常和肺癌不同分型逻辑网络中二阶逻辑类型分布的差异,可能是肺癌发生、发展的一个原因或结果,这将对肺癌内在机理的研究提供启示作用。2、生命系统的内在规律需要对其适当粗粒化后才能突现出来。在构建生命系统对应的生物网络过程中,选择合适的阈值继而对网络进行适当粗粒化是发现机体内在机理的重要前提。本文提出了一种确定基因网络阈值的新方法并将其应用于Parkinson疾病内在机理的研究上。利用Parkinson疾病的基因表达谱数据和表型,根据Parkinson表型和基因的关系,分别从基因角度和疾病角度建立Parkinson疾病的表型网络。对这两类表型网络进行比较,当它们的相似度达到最大时,基因网络的阈值为0.47和0.48。进一步,通过计算表型网络的特异性和敏感度,发现阈值也是在0.47和0.48时,特异性和敏感度之和达到极大值,这表明了该方法的有效性。另外,比对疾病和正常状态下基因网络的结构参数,阈值也是在0.47和0.48时两个基因网络差异最明显,进一步验证了方法的有效性。最后,分析了所确定的基因网络中有关联关系的基因所共享的Gene Ontology术语,说明了基因间关系的可靠性。3、根据表型和基因的关系,分析疾病表型间的关联和发展对疾病的诊断和治疗有重要意义。基于上述确定的基因网络,利用系统发生谱的逻辑分析方法逆向构建Parkinson疾病相关基因的逻辑网络。根据表型和基因的关系推测出Parkinson疾病的表型逻辑网络,挖掘出表型发展的66条可能路径。临床数据分析发现,其中49条路径中运动症状的发展与临床观察一致。并且,发现33条路径的初始表型为非运动症状表型,但临床观察上并没有出现这种情况,可能的原因是这些早期症状比较轻微的情况下在临床观察中容易被忽略。我们预测4个非运动症状—沮丧、焦虑、幻觉和人格改变是Parkinson疾病的初始表型。这种发掘Parkinson疾病表型发展路径的方法也可用于其他疾病表型发展的预测,将对疾病的诊断、治疗提供有益的启示。