【摘 要】
:
在蛋白质相互作用网络(protein-protein interaction,PPI)中,识别蛋白质复合物可以帮助揭示蛋白质的生物功能、解释特定的生物进程,这对于研究复杂疾病具有十分重要的意义。
论文部分内容阅读
在蛋白质相互作用网络(protein-protein interaction,PPI)中,识别蛋白质复合物可以帮助揭示蛋白质的生物功能、解释特定的生物进程,这对于研究复杂疾病具有十分重要的意义。如何从蛋白质相互作用数据中挖掘具有生物功能的蛋白质复合物,成为人们揭开生物体奥秘的突破口。高通量实验技术的发展帮助研究者们获得了许多大规模蛋白质相互作用数据,这使得利用计算方法在蛋白质相互作用网络中识别蛋白质复合物成为了可能。然而,由于实验环境不同和误差等原因,从高通量实验中得到的蛋白质相互作用数据往往存在着大量的噪声,这严重影响了蛋白质复合物识别算法的性能。针对相互作用网络数据中存在较高比率假阳性、假阴性的问题,本文从蛋白质自身的生物功能出发,利用基因本体语义相似度与蛋白质实验数据集融合来衡量蛋白质之间相互作用的可靠性;然后,利用提出的可靠性衡量方法来重构蛋白质相互作用网络,并且将几种复合物识别算法应用在这个重构的可靠网络中。实验结果表明,这几种算法在重构可靠网络中的识别精度和性能都有显著提升,并且识别出具有显著生物意义的复合物比例也明显提高。本文提出了一种基于GO语义相似度与边聚集系数的加权网络复合物识别算法一MWGE(Complexes Identifying Method in Weighted Network Based on Gene Ontology and Edge Clustering Coefficient)。该算法首先利用GO语义相似度与边聚集系数调和的办法共同衡量网络中相互作用边的有效性,并且生成加权网络;其次,本文采用迭代运行随机模拟流方法在加权网络中识别复合物;最后,运用入-module和重复率方法去除低效和冗余复合物。实验结果显示,MWGE算法识别的复合物可以更多地与标准复合物匹配,特别是在准确率和综合评价指标上明显高于其他算法。
其他文献
光动力治疗与光热治疗都是目前肿瘤治疗领域中具有广阔应用前景的微创治疗方法,是除传统治疗手段外癌症临床治疗方法的有力候补。两者都是基于光敏药物吸收光子能量产生能使癌细胞凋亡的效应实现肿瘤的消除或抑制。鉴于大量铋基半导体在此之前已经成功的应用于光催化研究,本论文设计了基于两种铋的硫属类半导体化合物的协同治疗体系,并将这两种化合物作癌症治疗中的增敏剂药物进行深入研究。初步了解这两种半导体化合物的形貌,结
植物由于自身生活方式特点,无法逃避不利的生境。为适应外在的生境,植物通过其细胞特有的内膜系统及膜泡运输机制完成细胞内外的物质与信息交流。在真核生物细胞中,蛋白质的
随着在线社交网络的快速发展,对网络中用户关系的研究越来越多,链路预测被应用到用户关系分析场景。链路预测是利用网络中已有信息对未知链接或未来链接的预测。由于社交网络
三相异步电动机具有坚固耐用、维护简单,在工业生产中得到广泛应用。三相异步电动机全压起动时起动电流大,对电网产生较大冲击,特别是电动机拖动重载负载起动时不仅起动电流
始于非制冷红外探测器技术的快速发展,嵌入式、物联网技术的强势崛起,红外热成像系统得到了广泛应用,随着其应用需求的逐渐积累增长,不断向着低成本、高帧率和高分辨率方向发
传统能源的过度使用已造成了严重的环境污染、能源危机和气候恶化等问题,因此世界各国都把新型可再生清洁能源的开发作为当前优先发展的重点领域。醇类燃料电池由于其污染低
贵金属纳米颗粒由于具有独特的电学、光学性质使其在国防科技、化工、催化、医学等领域都有着许多潜在的应用,从而被广泛研究。金属纳米颗粒的等离子效应可以对其周围场强有
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)指的是在基因组水平上因单个核苷酸变异所引起的DNA序列的多态性。在单体型关联研究中通过利用少量的SNP位点代表单体型
进入二十一世纪以来,能源危机与全球气候变暖问题日益加剧,已引起了全球范围内的关注。近二十年来,工业界和学术界将大力发展可再生能源(风能,太阳能,潮汐能等)视为解决全球
随着新一轮课程改革的不断深入,课堂教学在教学理念、教师方式、教学手段等方面都有了很大的改变。传统教学中,是以教师为主讲,学生听的模式来进行学习的。这种模式在一定程度上是可以帮助系统学习知识、掌握知识,并且能识记到相关的知识点。但却因缺少关注学生的主动性,忽略了学生的个性发展。课堂自主学习,是以学习者为主导,在教师的引导下主动设定习目标、制定学习计划、合理安排时间、有针对性地开展学习的过程。新课程改