朴素贝叶斯分类器预测拟南芥蛋白质相互作用及蛋白质功能注释

来源 :东北林业大学 | 被引量 : 1次 | 上传用户:wzhyskoa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命体功能真正的执行者,而蛋白质之间的相互作用在大多数的生物学过程比如细胞代谢、转录、调控机制、信号传导中发挥着重要作用。拟南芥基因组的测序完成后,有关功能基因组的研究已经全面展开。研究拟南芥蛋白质相互作用,特别是识别那些拟南芥特有的蛋白质,对于了解拟南芥蛋白质功能有着非常重要的作用。后基因组时代的到来为生物信息学在全基因组范围预测拟南芥蛋白质相互作用提供了丰富的数据和信息。近年来随着大规模实验技术、比较基因组学、生物信息学的发展,在蛋白质相互作用研究领域涌现出了各种预测方法,但是不同方法之间存在巨大差异,有其内在的偏好性。有机地整合不同的方法,对每种方法取长补短成为现阶段的研究热点。  本论文中首先收集了有助于预测拟南芥蛋白质相互作用的基因组数据以及蛋白质组数据,包括4种模式生物的共14987对蛋白质相互作用数据、3020对蛋白质功能域相互作用数据、拟南芥蛋白质功能域组成数据117090条、5组实验的445张芯片的不同拟南芥生物样本的基因表达谱数据、1960组拟南芥蛋白质生物功能注释数据、以及261种其他物种基因组序列数据。同时使用了现阶段在全基因组范围内预测蛋白质相互作用的方法,如基于蛋白质相互作用跨物种的保守性理论(Ortholog)、基因表达谱相似理论(Co-Expression)、功能结构域相互作用理论(Domain Pair Interaction)、最小共享生物途径理论(Share BiologicalProcess)、基因系统发生谱理论(Gene phylogenetic profiles method)、基因融合理论(Gene Fusion method)、基因邻近理论(Gene Neighbors method)等预测理论。  论文中对以上理论进行检验并针对朴素贝叶斯分类器进行优化。朴素贝叶斯分类器是一种简单高效的分类算法,被广泛应用于整合离散型数据类型。本论文中搜集的DIP、Bind、IntAct、TAIR等数据库、文献搜集到的拟南芥蛋白质相互作用集合同4666对相互作用作为正极数据和基因本体论注释数据库的亚细胞定位数据构建196855对蛋白质相互作用作为负极数据构成朴素贝叶斯分类器的训练集。本文使用朴素贝叶斯分类器,结合构建的训练集,对拟南芥全部蛋白质进行相互作用预测。最后预测得到了22622对相互作用的蛋白对,并通过预测的拟南芥蛋白质相互作用构建了拟南芥蛋白质相互作用数据库(ATPID)。结合拟南芥盐碱胁迫蛋白质构建了拟南芥盐胁迫下的蛋白质相互作用网络,揭示了其中重要的功能模块,同时还运用预测的蛋白质相互作用网络结合亚细胞定位的信息构建了拟南芥叶绿体中的蛋白质相互作用网络。
其他文献
通过与SSCP相比较,证实了变性高效液相色谱(denaturing high performance liquid chromatography,DHPLC)方法在人类基因组单核苷酸多态性(sigle nucleotide polymorphisms,SN
运用植物生态学、植物生理学与生物统计学相结合的方法,从叶和茎的外部形态特征、生长习性、光合与蒸腾作用特性及抗逆性等方面研究了假俭草的生物学特性,并对其草坪质量进行
该文主要由两部分组成,第一部分研究了β-乳球蛋白(β-lactoglobulin)和ubiquitin在低温下的折叠动力学,特别是折叠早期的反应过程.第二部分以单克隆抗体为探针研究了金黄色
忆阻器是具有记忆功能的非线性电阻,作为与电阻、电容、电感相并列的第四代电路元件。由于其制备受限于纳米工艺和严格的实验条件,短时间内还不能够走出实验室,导致对忆阻器
随着信息时代的飞速发展,人们对知识、信息的需求量日益增加。在快速大量的获取所需信息的同时,知识产权的问题也越来越引起人们的关注,数字水印技术的使用,很好的解决了知识版权
随着科技的高速发展和自动化程度的逐步提高,矿用绞车作为井下的重要提升设备,其运行的安全性与稳定性成为研究的重点。  首先,有效的控制方法和完备的电控系统是实现绞车高效
有序差异显示法(OrderedDifferentialDisplay,ODD)是一种简便的系统研究基因表达谱差异的有效方法.采用链霉亲和素和生物素的特异亲和性质分离目标cDNA片段,有效排除了非特异
蛋白质设计不仅是研究蛋白质折叠机制和蛋白质结构-功能关系的有效工具,而且具有很重要的实际应用价值.基于平均场理论,我们发展了一种新的蛋白质理性设计算法:异型自治系统
γ-谷氨酰半胱氨酸合成酶GSHⅠ(γ-glutamylcysteine synthetaseγ-ECS),又称谷氨酰-L-半胱氨酸连接酶,是谷胱甘肽(GSH)合成过程第一步的催化酶,由于合成产物GSH可通过反馈抑制
在2000年6~9月份的每月中旬用美国LICOR公司生产的LI-6400型便携式光合系统测定了松嫩草原碱化草甸混生群落芦苇的净的光合速率、蒸腾速率及相关生理生态因子,并用该系统配置