基于串联质谱数据的蛋白质-基因组学方法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:mgq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着质谱技术的发展,诞生了一门新的学科:蛋白质-基因组学。它是蛋白质组和基因组相交互的研究领域。通过基因组学和转录组学提供的信息,定制新的蛋白质序列数据库,再用这些蛋白数据库去检索质谱数据,从而鉴定全新的肽段。反过来,串联质谱得到蛋白质组的数据,可以提供蛋白质层面上的基因表达证据,从而进一步完善基因模型。  本文针对基于串联质谱的蛋白质-基因组学的热点研究进行了分析与研究,通过建立蛋白质序列数据库鉴定新肽段,并应用该方法研究了三个生物问题。文章的主要贡献为:  (1)提出了迭代式的蛋白质-基因组学研究流程。每一次实验都利用前次实验的结果作为输入,并加以过滤,同时本次实验的结果可以作为后续实验的部分数据源。本方法能将实验分成多个步骤,细化任务,把复杂问题简单化;能在每一步实验后较灵活地修正研究方向,使研究问题较快地收敛;对要寻找的特定突变类型具有较高的敏感性。  (2)设计了多个突变蛋白质序列建库算法。本文针对具体生物学问题设计了多个模拟突变蛋白质序列的算法,并具有多种输入接口,便于进行迭代研究流程。算法能够无缝地进行预实验和验证实验。  (3)研究了蛋白质翻译过程中的提前终止。本工作通过对前人实验结果的总结,提出了提前终止翻译蛋白质的假说,利用迭代式的蛋白质-基因组学研究流程进行实验分析,否定了实验假说,最终验证了蛋白质在溶液中酶切的现象。  (4)验证了基因上游开放阅读框。本工作对uORF问题进行了分析,提出了模拟建立uORF翻译后序列的算法,通过与前人Ribo-Seq结论的对比,证实了本算法的有效性。经过数据库搜索验证,发现uORF翻译后序列的降解速度快,不适合用串联质谱分析法来寻求证据。  (5)探究了核糖体延伸过程中的读框移位。本工作设计了扫描式的核糖体读框移位突变,生成了六种类型的读框移位突变蛋白质序列。通过数据库搜索鉴定,锁定了多甘氨酸的突变形态,并更改算法,建立了多甘氨酸突变蛋白质序列数据库。经过多次迭代式的数据库搜索,最终找到了多肽序列的N-terminal修饰。
其他文献
电气工程技术人员经常会遇到各种电气信号的测量、计算、分析等问题,当前解决这些问题离不开示波器、万用表、电气工程手册、计算器等。本课题试图设计一个类似掌上电脑的电
基于图像处理的隧道掌子面地质信息研究是采用现代计算机图像处理技术对隧道掌子面图像进行分析和研究,掌握开挖出露的掌子面及其前方的地质情况,为隧道设计与施工提供必要的参
近年来,由于微型制造技术、通讯技术及电池技术的改进,促使微小的传感器已经具备了感应、无线通讯及处理信息的能力,且其价格低廉,故在国防军事、环境监测、交通管理、医疗卫
随着P2P的即时通信、文件共享、流媒体播放以及协同办公等系统的迅猛发展,P2P技术已经对互联网产生了深刻的影响。但由于P2P网络自身的分散性、自治性、动态性和异构性等特点
随着网络的发展以及宽带网的普及,人们对多媒体信息服务的要求越来越高,希望有更好的信息服务提供给用户,而同步多媒体集成语言SMIL能够有效地整合各种媒体资源,满足人们的这
随着21世纪信息技术的高速发展,高校网络基础设施建设和信息系统建设也取得了重大突破。目前国内大部分高校均已部署了一定规模的网络应用,初步实现了网络办公、网络教学、网络
视频正不断以更多的表示格式,更多的设备类型和多种多样的网络环境进行制作和使用。视频转码是将一种视频编码格式转换为另一种视频编码格式的过程。然而,大多数时候,转码是
随着多媒体技术及网络技术的飞速发展,人们对数字产品的获取变得极为方便。由此带来的负面影响是,这些数字产品原创者的版权和经济利益常常受到侵犯,版权纠纷时有发生。如何保证
随着当今社会进入网络化信息化时代,网络信息作为一种新兴的信息资源而急剧增长。在其发布过程中,由于信息发布硬件设备的不同,各终端承载能力的差异,会导致相同信息在不同终
中国象棋的计算机博弈研究起步较晚,但是发展较快。到目前为止出现了许多优秀的中国象棋软件,如许舜钦及其团队的“ELP”、上海计算机博弈研究所黄晨的“象眼”等。但是这些