交联蛋白质谱鉴定的算法研究及软件开发

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:Evilkonata
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质序列鉴定是人类了解蛋白质的第一步,随着基于串联质谱鉴定的蛋白质鉴定技术日趋成熟,高通量、大规模的蛋白质序列鉴定已不再是难题;蛋白质交联技术建立了从蛋白质序列到蛋白质结构和蛋白质间相互作用的一座桥梁,与质谱技术结合的蛋白质交联鉴定使得高通量、大规模的交联质谱鉴定成为可能。   本文首先综述了交联蛋白的鉴定方法,在分析和总结目前已经存在的交联质谱鉴定算法的优点和劣势的基础上,提出了一套完备的交联质谱鉴定算法--pLink,它不仅能够鉴定纯化的蛋白样品,粗打分与细打分相结合的开放式搜索流程也使得高度复杂的样品的鉴定成为可能,同时它有效地利用了交联质谱特有的碎裂规律,并采用了一种简单可靠的假阳率估计与控制方法,使得大规模、高通量、可靠地鉴定交联质谱真正可行。   另外,本文也研究了E-value计算中的背景分数点选择问题,提出了简单的理论候选肽生成方法,并用大量实验证明了该方法的稳定性和有效性,最终这个方法被应用于pLink的E-value计算算法中,并取得了较好的效果。   通过在标准数据集上测试,pLink在小数据库上获得了99%的灵敏度,在大数据库上获得了95%的灵敏度,而且当FDR控制在5%时,获得了非常一致的正确率--95%,这证明了pLink的鉴定效果。同时,它被应用于UTP-B纯化蛋白样品、E-coli全交联样品、Worm全交联样品以及Fib-1免疫共沉淀样品的鉴定中,值得一提的是,它对于E-coli全交联样品的鉴定结果与国际上最好水平相比提高了1倍左右,而Worm全交联样品和Fib-1免疫共沉淀样品是交联质谱鉴定迄今为止所针对的最复杂的样品。   交联质谱鉴定是普通蛋白质序列鉴定的非平凡延伸,是一个源于“一般”的“特殊”问题,对于该问题的研究首先基于对普通蛋白质搜索引擎的学习和继承,而后其研究成果也与普通蛋白质鉴定中的问题互相印证,并可以反馈到普通蛋白质鉴定问题中。
其他文献
改善无线Mesh网吞吐量是当前无线Mesh网研究中的关键问题。随着无线电技术的发展,无线接口已逐渐具备频率捷变的特性,即无线接口能在短时间内动态地重配置通信信道的中心频率与
群机器人是典型的群体智能系统,主要研究一群能力相对有限的自主移动机器人如何在有限感知情况下,通过局部交互机制涌现出群体智能行为来合作完成相对复杂的规定任务。群机器
随着集成电路制造和设计技术的不断进步,芯片中晶体管的数目以指数性增长,这导致电路的测试数据量和测试时间急剧增加,测试成本显著上升。测试压缩技术在保障测试质量的前提下,能
近年来,辅助盲人使用计算机的软硬件技术取得了长足的进展,盲人使用计算机已经越来越方便。然而,还是有一些因素使得我国盲人无法和明眼人一样熟练便捷的使用计算机,其中,输入汉字
随着计算机和网络技术的迅猛发展,传统的工业生产正逐渐向以计算机为主导的自动化控制生产转变。在煤炭行业,发展以计算机自动化控制为核心的采煤工艺和监控技术,是近年来煤
“存储墙”问题一直是制约处理器性能的关键瓶颈,计算与存储的速度鸿沟导致CPU的运算能力因为需要等待存储器的数据而大量虚耗。在片上多核的处理器环境中,多个处理器核对共享
由于易用性和良好的扩展性,google提出的MapReduce编程模型被广泛应用于各类大规模数据处理和分析项目中。在实际应用中,一个分析项目往往需要分解成多个MapReduce作业,且这些计
多核已经成为处理器设计的主流技术,应用软件要想获得性能提升也必须实施并行化,并行编程也就成为了广大程序员不可回避的问题。   传统的并行计算多集中在高性能数值计算领
快速傅里叶变换(FFT)是许多信号处理系统的核心算法,不同的应用场合对FFT处理器有不同的性能要求。本文根据项目的总体设计要求,对快速傅里叶变换的相关技术进行分析研究,并结合
条烟装箱是卷烟生产的最后一道工序,在条烟装箱时,装箱机有时会工作混乱,特别是在条打包机生产流量较大或来料不够的情况下,装箱机的工作有可能会不正常,从而出现缺条、缺排或箱内