组织特异性PPI网络生物功能模块识别研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:rocxdp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
辨识组织特异性蛋白质相互作用(PPI)网络中关键蛋白质及功能模块对理解生物体的内在活动机制、具有针对性的疾病诊断和药物设计具有重要作用。识别蛋白质及功能模块需要高可靠性的PPI网络、高准确率的识别算法以及系统的功能分析方法。本文以人类组织特异性基因及其相应的PPI网络作为原始数据源,识别重要的Date Hub蛋白(DH蛋白),并对这些蛋白及其关联密集模块进行功能验证。同时,为了挖掘保守的功能模块,提出了一种基于半马尔科夫随机游走模型的迭代加权子图查询算法。本文的主要贡献包括:首先,针对已有的人类组织特异性基因及其相应的PPI网络,利用最短路径算法,设计和实现了一种基于MapReduce框架的强关联组织特异性基因编码蛋白相互作用网络构建算法。对人类肾脏和脑组织的PPI网络进行了实验验证,并对网络的可靠性给出了定量评价。其次,为分析和发现PPI网络中的组织特异性功能及关键蛋白,实现了一种融合网络拓扑距离和GO相似性两种度量的关联模块识别算法。在人类肾组织的PPI网络中,识别出118个DH蛋白,对36个强关联DH蛋白进行了分析,发现IGF1蛋白与其强关联模块在肾肥大疾病中的桥梁作用。最后,提出了一个基于半马尔科夫随机游走模型的迭代加权子图查询算法,以识别相互作用网络中的保守功能模块。结点相似性计算和目标图约简是子图查询算法中提高查询准确率和降低计算复杂性的两种常用手段。在结点相似性计算中,设计了基于半马尔科夫游走模型的集成结点本身相似性、结构相似性以及邻居结点相似性的综合度量方法;在目标图约简的过程中,通过迭代递减目标图中低相似性结点,以降低目标图的规模。对多个真实PPI网络查询的实验结果表明,算法在精度和时间复杂性方面都有明显提高。
其他文献
复杂网络的研究正逐渐涉及渗透到生命科学和工程学等众多领域,复杂网络中的动力学分析也受到了广泛关注,其中网络同步现象是一项重要研究课题。为了针对不同的复杂网络进行描
以往的研究表明,慢性口服三聚氰胺(melamine)会造成大鼠空间学习记忆功能和海马突触可塑性的损伤,而联合使用VC&VE可以缓解Melamine引起的损伤,其可能机制与氧化应激的降低有
随机Loewner演变(SLE)是一类含有一个参数的随机平面增长过程,它可以通过解驱动函数为一个Brownian运动的Lowner方程来构造.这个过程与渗流丛的尺度极限密切相关.在本文,我们
基于粗糙集理论的信息系统是Pawlak提出的,该理论的一些应用,如规则提取、不确定决策、分类与特征提取等都与信息系统有关.信息系统的约简是信息系统研究的一个重要问题,另一
随机Loewner演变(简称SLE)是一类含有一个参数的随机平面增长过程,它可以通过解驱动函数为一个时间改变的一维Brownian运动的Lowner微分方程来描述。这个过程与渗流丛的尺度
随机Loewner演变(简称SLE或SLE_κ)是通过解驱动函数为时间改变的布朗运动的Loewner微分方程来描述的一类带有一个参数κ的共形不变随机分形曲线族.对SLE_κ的研究,从上半平
近年来,矩阵特征值反问题在结构设计、参数识别、自动控制、量子力学、光谱分析等领域有广泛的应用背景,因此关于特征值反问题的研究已成数值代数热点课题。随着四元数应用范
教学模式是幼儿园教育教学活动正常开展的重要组成部分,能够有效地促进教育者从整体上综合地探讨教学过程的本质与规律。当前,幼儿园科学领域的教学活动虽已渐渐形成较为广泛认可的教学流程,但仍缺乏固定的、已形成一定理论的幼儿科学教育教学模式,以至幼儿园科学教育活动忽视幼儿探索性,或探索只是停于表面,缺乏一定的体系和深度的现象仍时有发生。4c教学模式作为由乐高教育引入的一种固定的教学模式,已有部分学者进行了一
学位
精细积分算法由于其计算速度快、数值结果精度高等优点,在常微分方程、控制理论等相关领域得到了广泛应用。但是,当常微分方程的系数矩阵较大时,其计算速度优势并不明显。因
随着信息时代的到来,大量的图片、视频等高维信息逐渐渗透到人们日常生活中,这些高维信息急需我们有效处理,虽然大量的科研工作者已经在这方面取得了一定的成果,但是还存在相