论文部分内容阅读
从诸多致病基因中发掘疾病的“关键”基因,对一些顽症的诊断与治疗以及药物设计都具有重要意义,也是当前生物信息学研究的一个重要课题。本文通过打分方法,对脑神经胶质瘤和结肠癌的相关基因进行探讨,从中发掘相应疾病的关键基因。具体内容如下: 基于疾病相关基因组在正常和疾病各分期的系统发生谱表达数据,通过逆向网络建模方法构建相应的互信息相关网络。利用已建立的互信息相关网络和疾病的相关表型,根据疾病表型与基因的关系以及疾病与表型的关系,分别从基因和疾病角度建立疾病的表型网络:前者建立的表型网络称为逆向表型网络,后者建立的表型网络称为正向表型网络。分别比较正向和逆向表型网络在疾病各分期相似度的连续变化情况,当相似度达到最大时,正常脑组织和脑神经胶质瘤I期、II期、III期和IV期基因网络的阈值分别为0.50、0.53、0.58、0.69和0.67;正常结肠组织和结肠癌I期、II期和III期基因网络的阈值分别为0.53、0.50、0.50和0.50。阈值确定后,我们得到相应疾病各个期对应的基因网络和表型网络。通过打分方法,挖掘出脑神经胶质瘤的7个关键基因和结肠癌的11个关键基因。在脑神经胶质瘤的7个关键基因中,有5个基因已被资料证实与脑神经胶质瘤的发生发展密切相关,剩下2个基因AR和ARAF中,基因ARAF也参与脑神经胶质瘤发生发展的生物路径;在结肠癌的11个关键基因中,有9个基因已被资料证实与结肠癌的发生发展密切相关,剩下的2个基因TCL1A和MCF2未有报道与结肠癌有关。我们预测4个基因AR、ARAF、TCL1A和MCF2可能在相应疾病的形成和发展过程中起重要作用。 提出用信息熵相关系数代替互信息建立基因网络。基于脑神经胶质瘤相关基因组在正常脑组织和脑神经胶质瘤I期、II期、III期和IV期的表达谱数据,利用信息熵相关系数,通过逆向网络建模方法构建相应的基因网络。重复上述确定阈值的方法,得到正常脑组织和脑神经胶质瘤I期、II期、III期和IV期的基因网络的阈值分别为0.47、0.50、0.50、0.50和0.50。通过打分方法,最后挖掘出脑神经胶质瘤的6个关键基因,其中5个基因已被资料证实与脑神经胶质瘤的发生发展密切相关,剩下1个基因AR未有报道与脑胶质瘤有关。比较信息熵相关系数与互信息两种方法所得结果发现:上述两种构建基因网络方法分别得到7个和6个脑神经胶质瘤关键基因,其中6个基因相同。进一步的文献查询发现6个相同基因中有5个基因都与脑神经胶质瘤的发生发展密切相关。两组关键基因中都出现AR,我们预测基因AR可能在脑神经胶质瘤的形成和发展过程中发挥着重要作用。