核酸结合蛋白的预测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mir80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与核酸结合的蛋白质称为核酸结合蛋白,根据结合对象是RNA或是DNA,分为RNA结合蛋白(RBP)和DNA结合蛋白(DBP)。通过与RNA或DNA相互作用,核酸结合蛋白在多种细胞过程中起到重要作用,比如基因的转录、转录后调控、翻译等。由于用实验手段识别核酸结合蛋白需要大量的金钱和时间的投入,因此需要开发能够大规模、高精度地预测哪些蛋白质可能与RNA或DNA有相互作用的计算方法,进而对实验设计有指导作用。本文对于核酸结合蛋白的预测问题进行了深入的研究,包括对RNA结合蛋白的预测、DNA结合蛋白的预测以及核酸结合蛋白的多类预测。为了具有更广的适用性,我们从蛋白质序列出发,结合支持向量机分类,开发了RBPPred方法,进行RNA结合蛋白的预测。采用的蛋白质特性包括:氨基酸的疏水性、极性、标准化的范德瓦尔斯体积、极化性、预测的二级结构、预测的溶剂可及性、侧链的带电性和极性以及蛋白质的进化信息。结果显示,RBPPred在2078个RBPs和7093个non-RBPs采用十倍交叉验证,取得的灵敏度为83%,特异性为96%,马修相关系数为0.808。并且,在独立的人类蛋白质数据集上进行测试,RBPPred取得的灵敏性为84%,特异性为97%,马修相关系数为0.788。通过与其他方法在不同数据集上进行比较,结果表明,RBPPred比目前已知的其他方法取得的结果要好很多。另外,我们还测试了RBPPred方法预测新RBPs的能力,进一步证实了该方法的实用性和预测能力。最后,我们把RBPPred应用到不同物种的蛋白质组上,在每个蛋白质组中都预测了一些可能的RNA结合蛋白,并对蛋白质中含有的保守性RNA结合结构域进行了分析。在RBPPred的基础上,我们进行了进一步的改进和完善,主要包括数据集的更新、增加了3个重要的属性特征、探索了不同序列比对数据库对RNA结合蛋白预测的影响,开发了RBPPred2.0。结果表明,RBPPred2.0相对于RBPPred在预测性能上有进一步提升。鉴于RBPPred2.0在RNA结合蛋白预测中的优异表现,我们把RBPPred2.0中用到的所有属性特征扩展到DNA结合蛋白和核酸结合蛋白的多类预测中,开发了DBP-Pred和NABP-Pred方法。经测试,DBP-Pred在含有1244个DBPs和1244个non-DBPs的非冗余的独立测试集上取得的预测灵敏度、特异性、MCC值分别为66%、87%和0.548,比其他方法的预测性能要好。在核酸结合蛋白的多类预测中,根据蛋白质与核酸的结合情况,我们定义和构建了四个新的蛋白质数据集(分别是DRBP、o DBP、o RBP、non-NABP),可以在一个模型上进行DBPs和RBPs的预测。这种全新的数据集定义方式,在核酸结合蛋白的预测算法中是第一次。通过在含有212个DRBPs、1939个o DBPs、1314个o RBPs和4993个non-NABPs的数据集上进行五倍交叉验证,NABP-Pred取得的总体预测准确度为76.08%。
其他文献
<正>随着当前我国经济社会的快速发展,相应促进了各行业快速发展。其中在当前科学技术推动下,电子商务快速发展,促使传统财务会计工作受到较大冲击。财务会计工作对实现企业
互动式针刺法是作者根据自己和同道的临床实践总结出的一种新的治疗方法。运用此法治疗内脏系统有关疾病和运动系统软组织损伤,疗效优于传统针法。本文介绍了该法的操作、选穴
期刊
目的:肥胖是铁缺乏的重要危险因素,而胰岛素素抵抗与肥胖密切相关。本研究旨在于探讨高脂性肥胖诱导的肝脏铁缺乏对胰岛素抵抗的影响,及可能涉及的机制。方法:C57BL/6J小鼠随
【正】对于以汉语为母语的中国人来说,由于受汉语句型和语言习惯的影响,许多人汉译英时,经常按汉语习惯译成中国式的英语。经过几年的教学实践,笔者认为要想学好汉译英,避免
<正>我师谢强教授从医三十余载,勤于临床,治学严谨,对五官科疾病的治疗有其独特方法和独到的见解。临床善用针刺运动疗法治疗痛证和五官科病症。吾侍诊其旁,曾亲睹老师以针刺
会议
<正>我们局的谢烟客,并非《侠客行》里的武林高手,而是因为嗜好吸烟,所以人送外号"谢烟客"。老谢43岁,干巴精瘦,是我们刑侦大队副大队长,他的烟龄与工龄一样长。干了几十年的
提出了一种无监督的特征选择方法,其基本思想是利用聚类来指导特征选择,对于无类别标签的数据样本集,先进行聚类获得数据类标签,再利用ReliefF算法进行特征选择.采用聚类集成方法
随着经济的不断发展,全国各地的电力需求都在增加,基于此国家电网建设工作正在不断完善,近年来尽管我国电力企业在电网建设、电力资产优化、成本管理等方面取得了一定的成果,
从相关历史文献中提取数据,采用最邻近指数、核密度分析、重心迁移等方法,对清代(1636—1911年)宁夏清真寺的时间和空间分布状况,以及清真寺的分布与政策、自然等因素的相关度进行
家庭教育是学校教育和社会教育的基础,对孩子的发展和成长发挥着不可或缺的作用,对小学生的作用更大。要使家庭教育科学化,需要家长更新家庭教育的观念、提高素质水平。如何