基于蛋白质网络的人类遗传致病基因预测算法研究

被引量 : 0次 | 上传用户:caery
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类遗传疾病基因的预测是目前生物信息学研究中的一个热点问题。随着基因组测序的完成和新一代测序技术的发展,基因以及蛋白质相互作用网络数据不断增长。通过这些数据来分析预测致病基因给人类破译疾病的遗传基础和分子基础带来了新的方法,对基因组学和医学都具有重要的现实意义。本文依据遗传疾病临床描述与蛋白质相互作用网络的关联关系,获取相关数据,首先对人类遗传疾病在线数据库进行文本挖掘,通过向量空间模型的方法,计算遗传疾病表型之间的重叠关系,其次利用蛋白质相互作用关系数据计算相互作用评分,加上疾病-蛋白质关联关系数据,共同构建了一系列生物网络,对疾病表型和蛋白质网络数据进行分析,基于这些网络数据对疾病的候选致病基因进行打分和排序,来预测疾病基因。本文提出了两种新的基于网络的人类遗传疾病基因预测方法。第一种在传统的二维关联概率模型的基础上,提出了基于多维随机变量的两种新的概率模型——中心概率模型和外形概率模型,在此基础上,提出了基于多概率融合的致病基因预测数学模型。还有一种是使用过滤函数的回归分析预测,通过观察网络和概率模型数据,总结数据规律,加入生物学假设,使用过滤函数融合回归分析进行候选基因的排序。基于多概率融合的预测模型通过综合利用联合概率、中心概率和外形概率,在多个层面上反映了表型相似性与蛋白质相互作用之间的关联规律,与传统的基于单一概率的模型相比,该数学模型更好地反映了生物系统的真实面貌,具有更强的疾病基因预测能力。而另一个使用过滤函数融合回归分析的预测模型,根据合理的生物学假设,反映疾病表型重叠中蕴含的基因关联关系,可以有效的将很多非致病基因排在队列的后面,有效增强了预测方法的效率。
其他文献
国立劳动大学是南京国民政府成立后创办的第一所国立大学。它的兴办获得了国民党四元老蔡元培、吴稚晖、李石曾、张静江的鼎力支持。该校以工读主义为思想和理论基础,倡导通
目的探讨乙型肝炎病毒(HBV)父婴垂直传播的危险因素;分析血液HBV-DNA载量、精液HBV-DNA载量与父婴垂直传播的关联;研究HBV父婴垂直传播中父婴所携HBV的基因型是否一致。方法
随着许多新兴企业迅速崛起,各行业中企业间的激烈竞争,免不了使一些企业一味的追求经济效益而忽略了对内部控制的重视,从而出现一些因为内部控制管理不善而经营失败的案例。
目的 从循证医学的角度评价护理干预对老年轻度认知功能障碍(MCI)患者的效果。方法 检索Pubmed、中国期刊网、万方数据库,收集符合纳入标准的轻度老年认知功能障碍者护理干预项
介绍了东城提灌工程沉沙池设计的主要成果,该项设计遵照设计规范要求的设计内容,及其主要计算方法进行设计,包括沉沙池设置条件、设计入池流量、泥沙设计特征值及设计标准、沉沙
介绍了我国国防知识产权定价的现状,分析了当前三种主要价值评估方法在国防知识产权定价上的适用性,并提出了基于效能导向的定价模式,最后给出了不同定价模式的选用原则。
目的探讨肾康丸含药血清对晚期氧化蛋白产物(AOPP)诱导的体外培养足细胞(MPC5)单核细胞趋化蛋白1(MCP-1)表达的影响及其机制。方法制备肾康丸含药血清和AOPP;体外培养MPC5,用
<正>题目在直角坐标系x Oy中,抛物线C的顶点是坐标原点O,准线方程:y=-1.(1)求抛物线C的方程;(2)过点P(2,-1)向抛物线C作切线,切点分别为A,B,求直线AB的方程;(3)过点P(t,-1)(t
二战以来美国进行了五次军事凯恩斯主义实验,产生的效果不尽相同。导致美国奉行军事凯恩斯主义的原因很多,有认识观念上的、有经济体制上的、也有军事—工业复合体的利益推动
统计计算中的有效数字问题郑州电力高等专科学校马保立目前我国统计教材中几乎没有涉及到统计数据的有效数字问题,这是一个失误。统计作为定量描述的方法,是不应该忽视有效数字