基于量子算法的苹果及PCD相关蛋白亚细胞定位体系研究

被引量 : 0次 | 上传用户:yyj55555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动物、植物等真核生物的蛋白质学、蛋白质组学方面的研究在后基因组时代变得越来越重要,由于多种生物(包括果树中的苹果、葡萄在内)基因测序工程的完成,研究的重心开始向确定基因的蛋白质产物功能方向移动。果树蛋白质亚细胞定位是果树蛋白质组学、果树细胞生物学和果树分子生物信息学的重要研究内容。果树蛋白质分子生物功能的实现一方面与代谢、信号传导等果树生物过程紧密相关,另一方面果树蛋白质分子必须处于特定的亚细胞区域才能行使其生物功能。对于未知功能的果树蛋白质获取其亚细胞的位置信息对进一步研究该蛋白质的分子功能是十分必要的。通过生物实验技术手段获取一个果树蛋白质亚细胞定位信息是通常的做法,但是这种做法消耗时间较长且实验成本较高,同时由于果树蛋白质序列的快速增长,在短时间内获取规模化蛋白质亚细胞定位信息(例如:苹果全基因组蛋白质亚细胞定位信息)只能依靠生物信息技术手段来完成。另一方面,从生物数据角度来看生物信息学主要可以分为三个研究领域:大量生物序列数据的生成与管理、生物数据的使用与分析、生物数据分析平台工具的研究与开发。由于生物信息数据大量的产生以及生命科学研究的迅猛发展,无论是从科学研究还是生产实践,人们急需能满足需求的生物数据分析平台工具,在一些研究课题中生物数据分析平台工具甚至成为制约深入研究的瓶颈问题。同时,由于生物数据分析平台工具研究与开发往往需要来自生物、数学、物理、化学、信息科学等多领域的知识,这也增加生物数据分析平台工具研究与开发的复杂性。所以在果树生物数据分析平台工具方面开展深入的研究是十分必要的,并且也具有重要的实践应用价值,这也是我们研究工作的目的之一。本文以量子算法为主,针对PCD相关蛋白质亚细胞定位预测中的生物信息技术问题和苹果蛋白质亚细胞定位预测的实现问题进行了深入的分析与研究,结合生物物理和物理的知识,提出了具体的解决办法和实现方案。本文的主要工作和创新之处概括如下:1.从蛋白质氨基酸序列的组成出发,利用物理学中粒度的思想,提出了蛋白质氨基酸序列的粒度概念,结合具体氨基酸序列片段详细阐述了蛋白粒度的构成。使用蛋白粒度对氨基酸序列进行分析,进一步给出了蛋白粒度的阶、蛋白粒度的界、蛋白粒度的极限、蛋白粒度增量等概念。在深入的研究时发现:蛋白粒度沿序列不均匀分布;每条蛋白序列都有各自的蛋白粒度的极限;对于所有蛋白来讲,蛋白的各阶粒度都有共同的界。如果从蛋白预测的应用来讲,还可以得出:蛋白粒度包含了氨基酸序列的组成信息,包含了氨基酸序列的排列信息,还包含了同种氨基酸的互邻信息,同时蛋白粒度增量自然包含了氨基酸序列的长度信息。对于如何利用蛋白粒度的理论和知识来构造蛋白序列的特征向量,本文给出了一种具体的构造方法并对有关参数进行了详细的说明。根据蛋白粒度增量的信息对标准数据集的蛋白质二级结构类以及植物蛋白亚叶绿体定位进行预测,得到比前人更好的结果,这些进一步说明了蛋白粒度是反映蛋白质属性的非常有用的指标。2.选择ZD98、ZW225、CL317凋亡蛋白标准数据集,利用蛋白粒度对凋亡蛋白序列进行特征提取,得到38维蛋白序列特征向量,对量子神经网络算法(QNN)进行改进后,对凋亡蛋白进行亚细胞定位预测,分别获得了87.8%、83.1%、85.5%的总体预测精度,这些预测精度等于或高于原作者的预测精度,说明蛋白粒度与QNN结合的方法在凋亡蛋白亚细胞定位预测上是有效的。3.利用已经公布的苹果全基因组蛋白序列,对苹果全基因组蛋白序列进行粒度等特征提取,分别得到苹果全基因组蛋白二阶粒度组成、三阶粒度组成、粒度多空间融合等特征向量,然后根据量子力学中波函数的叠加思想研制了新的量子算法(QSVM),对苹果全基因组蛋白63541条氨基酸序列进行了亚细胞定位预测,获得了相应的定位信息,并形成了苹果全基因组蛋白亚细胞位点数据库1。4.在Chou构造的一个高质量的植物蛋白细胞多定位基准数据集的基础之上,本文提出分别处理的预测模式,对多标签蛋白和单标签蛋白分别进行预测,同时利用GO注释对蛋白序列进行特征提取,取得了较高的预测精度,为蛋白的多定位预测找到了一种新的方法。5.在苹果全基因组蛋白数据集的基础上,对有GO注释的苹果蛋白进行了GO注释特征提取,结合本文提出的蛋白粒度的有关理论和知识,再进行蛋白粒度特征提取,研制了新的量子算法(SQSVM),对在苹果全基因组上筛选出来的含GO注释的15297条蛋白氨基酸序列进行了亚细胞定位预测,给出了相应的定位结果,在此基础之上构建了苹果全基因组蛋白亚细胞位点数据库2。6.作为生物数据分析平台具体体现的亚细胞定位网站--苹果蛋白亚细胞定位系统网站和植物蛋白亚细胞多定位系统网站的建设,利用本文有关的研究结论,现已完成。即将开通,对中外免费提供服务。
其他文献
摘要:液体静压导轨作为超精密加工机床的关键基础部件之一,对机床的加工精度起着决定性的作用。在查阅国内外相关研究文献的基础上,本文对静压导轨工作特性及其影响因素进行了
近年来对于《水浒传》的研究在世界范围内都取得了显著成效,然而对于《水浒传》英译的研究却相对较为滞后。虽然译介对与《水浒传》的英译研究正在进行不断的尝试,然而很难得到
90年代以来,企业对外宣传材料(特指企业简介)的翻译研究和应用有了长足的发展,这不仅仅表现在相关研究论文的数量上,还表现在研究的范围上,包括翻译技巧或原则探索研究、评论
目的原发性肾病综合征(Primary nephrotic syndrome,PNS)是病因不明的肾小球疾病引起的临床症候群,是泌尿系统常见疾病之一,发病率较高,激素疗法为目前诱导PNS缓解的首选药物,且用药
阅读柏拉图的著作,我们可以深深地感到,把being翻译为“存在”会给我们的理解带来一些问题。比如,“人是万物的尺度”这一著名论题被翻译为:人是存在的事物存在的尺度,也是不存在
<正>系统方案设计与论证1.课题要求电动车跷跷板由一个电动玩具车和自制的跷跷板组成。包含控制和检测两部分,实现电动车按要求在跷跷板上运动。在跷跷板起始端A一侧装有可移
本文以桂林电子科技大学"电气工程及其自动化专业"专业教学改革为例,结合本科毕业设计教学过程和完成情况,对本科生创新意识、创新精神与实践创新能力的培养展开讨论。针对毕
索尔·贝娄(1915-2005)是出生于加拿大的美籍犹太人,被公认为继海明威和福克纳之后当代美国文学代表人物。其最重要的代表作《赫索格》出版于1964年。通过精妙的心理描写和独
目前,涡扇发动机是世界上军用和民用飞机中最常用的航空动力装置,轴流压气机是涡扇发动机的核心部件之一。在压气机的运行中,由于气流原因将导致压气机工作不稳定乃至发动机
学习和研究语言与文化有侧重于共时研究和比较研究的倾向。本文结合人类历史,从历时研究的视角对语言与文化进行了探索性的探讨。本文将语言与文化的历时研究分为三个阶段—