疾病关键基因的挖掘方法及其应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:gsdfs334
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从诸多致病基因中发掘疾病的“关键”基因,对一些顽症的诊断与治疗以及药物设计都具有重要意义,也是当前生物信息学研究的一个重要课题。本文通过打分方法,对脑神经胶质瘤和结肠癌的相关基因进行探讨,从中发掘相应疾病的关键基因。具体内容如下:  基于疾病相关基因组在正常和疾病各分期的系统发生谱表达数据,通过逆向网络建模方法构建相应的互信息相关网络。利用已建立的互信息相关网络和疾病的相关表型,根据疾病表型与基因的关系以及疾病与表型的关系,分别从基因和疾病角度建立疾病的表型网络:前者建立的表型网络称为逆向表型网络,后者建立的表型网络称为正向表型网络。分别比较正向和逆向表型网络在疾病各分期相似度的连续变化情况,当相似度达到最大时,正常脑组织和脑神经胶质瘤I期、II期、III期和IV期基因网络的阈值分别为0.50、0.53、0.58、0.69和0.67;正常结肠组织和结肠癌I期、II期和III期基因网络的阈值分别为0.53、0.50、0.50和0.50。阈值确定后,我们得到相应疾病各个期对应的基因网络和表型网络。通过打分方法,挖掘出脑神经胶质瘤的7个关键基因和结肠癌的11个关键基因。在脑神经胶质瘤的7个关键基因中,有5个基因已被资料证实与脑神经胶质瘤的发生发展密切相关,剩下2个基因AR和ARAF中,基因ARAF也参与脑神经胶质瘤发生发展的生物路径;在结肠癌的11个关键基因中,有9个基因已被资料证实与结肠癌的发生发展密切相关,剩下的2个基因TCL1A和MCF2未有报道与结肠癌有关。我们预测4个基因AR、ARAF、TCL1A和MCF2可能在相应疾病的形成和发展过程中起重要作用。  提出用信息熵相关系数代替互信息建立基因网络。基于脑神经胶质瘤相关基因组在正常脑组织和脑神经胶质瘤I期、II期、III期和IV期的表达谱数据,利用信息熵相关系数,通过逆向网络建模方法构建相应的基因网络。重复上述确定阈值的方法,得到正常脑组织和脑神经胶质瘤I期、II期、III期和IV期的基因网络的阈值分别为0.47、0.50、0.50、0.50和0.50。通过打分方法,最后挖掘出脑神经胶质瘤的6个关键基因,其中5个基因已被资料证实与脑神经胶质瘤的发生发展密切相关,剩下1个基因AR未有报道与脑胶质瘤有关。比较信息熵相关系数与互信息两种方法所得结果发现:上述两种构建基因网络方法分别得到7个和6个脑神经胶质瘤关键基因,其中6个基因相同。进一步的文献查询发现6个相同基因中有5个基因都与脑神经胶质瘤的发生发展密切相关。两组关键基因中都出现AR,我们预测基因AR可能在脑神经胶质瘤的形成和发展过程中发挥着重要作用。
其他文献
批改完案上的作文,闭目遐思让教者无不感到头痛,因为学生习作中出现的智力或非智力因素导致的错误接踵而至。不是脱离实际的 “假、大、空 ”,就是 “ 四不像 ” 的作文;不是牵强
投资组合问题一直是金融理论研究与金融实践应用的核心和基础,当前,我国证券市场在体现日益国际化特点的同时,还存在市场品种不完善等众多缺陷,因此,深入开展国际证券组合以及含期
本文通过对荣华二采区10
隶属度和非隶属度取值为模糊数的模糊数直觉模糊集更符合人们的思维方式,克服了区间直觉模糊集无中心的缺陷,对直觉模糊集理论及其应用具有重要意义。目前还没有关于模糊数直
如果薄差储层出现砂堵以及压不开等情况,那么在压裂的过程中就很容易因为固井的质量不好而出现窜槽的现象。在实际的石油工程中应该要对质量进行严格的控制,同时还要加强对井下
生物数学模型不仅可以用来描述自然生态现象,表述生态过程,对生物系统进行定量和定性研究,还可以帮助解决一些复杂生态问题,因而具有很高的理论意义和应用价值。而且,环境的
本文基于有限差分方法对一维和二维的耦合非线性Klein-Gordon-Schr(o)dinger方程构造紧致差分格式并给出相关理论证明和数值实验.  我们首先对一维耦合非线性Klein-Gordon-
期刊
形成性评价是一个收集和组织学生学习的过程,对探究学生英语学习过程,并进一步促进学生综合素养的提升起着重要作用.目前,在我国各类职业学校还是以传统的终结性评价为主的评
在泛函微分方程定性理论和差分方程的研究过程中,振动性理论是一个重要组成部分.在实际生活中,如生物学、经济学、物理学等学科中出现了大量的模型,并且是应用泛函微分方程和