基于功能模块检测的成对生物网络全局比对研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:caiwenta
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着先进的高通量技术的快速发展,越来越多的人类生物学信息被充分挖掘了出来,形成生物网络,对生物信息学的研究也越来越重视,而蛋白质是生物体正常运行的必要组成,通过比对不同物种间的蛋白质相互作用,可以实现物种间知识转移,进行蛋白质复合物预测、预测蛋白质的功能、检测生物学路径等。生物网络比对的数据规模较大,为了以更高效的方法得到较为优越的比对结果,本文利用功能模块检测和种-子扩展方法实现网络比对。在网络比对的过程中,蛋白质之间的相似性的计算是重要环节,能够为后续比对奠定良好的基础。一般从序列和拓扑两个角度考虑蛋白质间的相似性,但由于网络中存在噪声,且序列信息是通过技术手段从生物系统中计算得到的,存在不完整性,仅考虑拓扑或序列信息可能对比对产生误导,且序列相似不意味着功能相似。本文针对这两个问题提出解决方法:将序列信息与拓扑信息结合辅助比对,减少了噪声和序列信息不完整对网络比对的影响;由于生物网络高度模块化的特性,将功能模块检测融入到网络比对中,可以在比对中加入功能信息,弥补了序列信息的不足,并且提高比对的效率。本文主要将研究集中在成对网络的全局比对,将功能模块检测引入到网络比对之中,优化网络比对结果,主要研究内容如下:⑴为了提高种子-扩展方法的效率和比对结果,本文将功能模块检测与种子筛选相结合,提出了一种基于模块匹配的成对网络比对算法,JAlign算法。仅根据目标函数选择种子节点,缺少了功能信息,会使得节点对缺少功能相似性,影响蛋白质功能的预测。JAlign算法将模块检测与种子-扩展相结合,利用层次聚类检测功能模块,并根据目标函数从模块中挑选出种子节点,综合评价邻居节点的拓扑结构相似性、度和节点总相似性,迭代选择最优的邻居节点进行扩展,并对其他不能扩展到的节点进行后续比对。实验表明,JAlign算法充分利用了节点的拓扑信息,能够实现良好的拓扑与生物质量的平衡。⑵功能模块检测中提取的模块可能存在重叠,为了充分利用模块间的拓扑和功能特征,本文将功能模块检测与目标函数的构建相结合,提出了基于模块特征和生物信息的成对网络比对算法,Mo Align算法。同一节点对重复地在多个模块对中比对上,则说明这一节点对具有很高的相似性。Mo Align算法首先根据模块划分计算模块相似性,并将模块相似性关联到节点的相似性中,重复比对的节点对进行模块相似性的叠加,以贪心的方式比对部分重要节点,并对其邻居节点利用匈牙利算法将其中的精英部分比对上,最后利用种子-扩展方法优化比对。实验表明,Mo Align算法充分利用了模块信息,在得到更多的同源蛋白的同时提高了算法的效率。⑶网络比对的应用。本文将成对网络比对算法JAlign算法以纯拓扑的方式应用到代谢网络中产甲烷菌的两种网络中,即嗜热产甲烷菌(Methanopyrus kandleri,MKA)网络和常温产甲烷菌(Methanosarcina acetivorans,MAC)网络,通过比对分析其代谢路径的差异,揭示产甲烷菌嗜热性的原因,从而验证网络比对在分析物种功能差异性方面的应用。
其他文献
随着人类基因组计划和分子测序计划的成功实施,对生命活动至关重要的蛋白质正逐渐揭开它们神秘的面纱。DNA结合蛋白是生物体中不可或缺的蛋白质,在遗传信息转录、DNA复制、重组和修复中都有着举足轻重的作用,且与许多疾病的治疗息息相关。与此同时,如PDB,Swiss-Prot和SCOP等世界著名的生物信息数据库,其每年的蛋白质序列呈指数型增长,人们对高效处理海量生物信息有着更为迫切的需求。而传统的实验室研
蛋白质N-糖基化修饰是真核生物中最常见的翻译后修饰之一,其影响着蛋白质的结构和功能,包括蛋白质的折叠、分子识别、稳定性以及免疫原性等。然而,在哺乳动物细胞中表达生产重组蛋白仍然面临着一些难题。其中最主要问题是重组蛋白上N-聚糖的异质性,这会对重组蛋白的功能和稳定性产生不利影响,如抗体依赖性细胞介导的细胞毒作用以及重组蛋白在体内的半衰期等。目前,随着基因编辑技术,细胞工程以及糖工程等多门学科的发展,
糖基磷脂酰基醇(glycosylphosphatidylinositol,GPI)锚定修饰是广泛存在于真核生物中的蛋白质翻译后修饰方式之一。哺乳动物细胞中超过100种蛋白被GPI锚定修饰,GPI锚定蛋白在机体生长、发育中发挥重要作用。在GPI锚定蛋白的生物合成过程中,前体蛋白进入内质网后,在GPI转移酶复合物的作用下共价连接在新合成的GPI锚上,形成新生GPI锚定蛋白。随后新生GPI锚定蛋白在内质
胶原蛋白由三条多肽链缠绕折叠成三股螺旋,进一步通过组装、交联等方式形成胶原纤维、胶原网状蛋白等高阶结构蛋白,作为生物材料在组织工程等领域具有广泛的应用前景。为了降低动物组织提取可能引发的疾病传播风险,研究人员采用微生物重组表达的方式生产胶原蛋白,然而在重组胶原蛋白的生产中如何促进重组胶原分子交联,使其形成更加稳定的空间结构是设计重组胶原纳米材料需要克服的难点。本课题以来源于Streptococcu
中国仓鼠卵巢(Chinese hamster ovary,CHO)细胞是目前生物制药领域应用广泛的生产细胞。传统构建重组细胞株的方法是将目的基因随机整合到染色体基因组中并经过多次压力筛选获得高表达水平的目的细胞株,整个过程费时费力,并且经常由于整合位点的不稳定性随着传代次数增加非生产性细胞克隆逐渐增多,导致产量下降。寻找稳定的整合位点,使用定点整合的方法将外源基因定点整合至CHO细胞基因组的稳定位
目前拉曼光谱在物质检测领域获得了很多的应用研究,但是基在定量检测方面的相关研究还很少,同时传统的定量检测模型存在一些缺点。定量检测的主要难点在于难以有效地对不同浓度的光谱数据进行建模,且难以有效地针对不同浓度的数据进行区分。为了解决上述问题,本文提出一种新的基于集成学习的神经网络框架,通过基于多种神经网络模型对拉曼光谱数据进行建模,并利用集成学习方式融合不同模型建模的结果,来有效提升基于神经网络的
丙氨酸脱氢酶(ADH;EC.1.4.1.1)属于氧化还原酶类,该酶可以利用NAD(P)+和NAD(P)H作为辅酶,催化丙氨酸和丙酮酸之间的相互转化。它在细菌、真菌和植物中普遍存在,是糖代谢和氨基酸代谢过程中非常重要的酶,在食品、医药、生物技术领域已被广泛应用。本研究对致病菌Helicobacter aurati的基因序列进行分析,发现它存在两个潜在的ADH蛋白序列,我们将其命名为HaADH1和Ha
塔格糖是一种具有特殊保健功能的甜味替代剂,广泛应用于食品、药品、保健品和化妆品等领域,市场需求量较大。本研究构建了催化乳糖合成塔格糖的两个关键酶(β-半乳糖苷酶和阿拉伯糖异构酶)单独表达、共表达的重组大肠杆菌,并对重组菌株全细胞催化乳糖合成塔格糖的条件进行了优化。基于食品安全方面的考虑,利用无抗性基因筛选标记的枯草芽孢杆菌为表达宿主,分别克隆了β-半乳糖苷酶和阿拉伯糖异构酶,构建重组枯草芽孢杆菌,
冷冻充气乳液,包括冰淇淋和各种搅打酱料等,是一种由水包油乳液经过搅打冷冻形成的蛋白泡沫体系。目前,牛奶蛋白是这类产品中最常用的蛋白源,但牛奶蛋白热量较高,并对过敏者不够友好。豌豆蛋白具有良好的营养价值和较低的致敏性,是一种重要的植物蛋白源,必需氨基酸含量丰富,符合消费者对于健康的需求。但是豌豆蛋白致密的结构,导致其乳化性能、起泡性能等功能性质较差,都限制了豌豆作为蛋白源在食品工业中的应用。因此,本
杂环胺(heterocyclic amines,HAs)是在高温烹调富含动物源蛋白质的原料过程中,生成的一类具有致癌致突变作用的杂环芳香族化合物,目前对HAs的研究多是以葡萄糖、肌酸(酐)和游离氨基酸反应生成的游离态HAs为主。然而,肉类中蛋白质含量约20%,远远高于葡萄糖、肌酸(酐)和游离氨基酸的含量(0.1%~0.5%),肌肉蛋白很可能会参与美拉德反应生成以肌肉蛋白-HAs结合物形式存在的HA