Ago蛋白数据库构建与预测研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:wwwunix
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Argonaute(Ago)蛋白在生物体中广泛表达。真核Ago蛋白是RNA干扰通路中的关键蛋白,调节基因表达;原核Ago蛋白是细菌抵抗侵入性遗传元件的防御系统,具有成为基因编辑工具的潜力。近年来生物信息学发展迅速,目前生物学研究逐渐由传统生物学湿实验过渡到实验与生物信息学结合的研究模式。数据库与预测器是该领域两个重要的研究内容。在现有数据库中,还没有专门的Ago蛋白数据库,且公共数据库中的Ago蛋白数据存在收录不全、结构域注释不完整等问题。此外,蛋白数据库Uni Prot仅收录了极少数经人工审核的Ago蛋白,表明还有很多潜在Ago蛋白亟待被发现。随着大量组学数据的不断增加,迫切需要基于计算方法促进潜在Ago蛋白的发现。因此,本文进行了两方面的研究:第一,以Ago蛋白结构域信息作为关键信息构建Ago蛋白数据库AGODB(http://i.uestc.edu.cn/agodb/),总计收录了1898条Ago蛋白。其中,1373个Ago蛋白拥有完整的结构域信息,512个Ago蛋白拥有部分结构域信息,13个Ago蛋白无结构域信息。AGODB的构建将促进Ago蛋白结构、功能与进化的研究,也为后续的数据挖掘工作提供了数据资源。第二,基于机器学习方法构建Ago蛋白预测器AGOPredict(http://i.uestc.edu.cn/agopredict/cgi-bin/AGOPredict.pl)。本文收集了233条非冗余的Ago蛋白和非Ago蛋白作为训练集,基于氨基酸组成和二肽组成进行特征提取,并进一步优化特征。经过多种机器学习方法的比较,最终选择支持向量机的方法构建分类模型。在十折交叉验证中,该模型获得了96.35%的准确度。AGOPredict是第一个基于机器学习算法预测Ago蛋白的计算模型,将有效促进新Ago蛋白的发现。
其他文献
目的 分析鸦胆子油乳注射液联合胸腺五肽姑息治疗Ⅳ期无驱动基因非小细胞肺癌的效果。方法 选取本院2017年4月至2019年11月收治的80例Ⅳ期无驱动基因非小细胞肺癌患者,按照不同的治疗方案将其分为对照组与观察组,各40例。对照组采取胸腺五肽姑息治疗,观察组采取鸦胆子油乳注射液联合胸腺五肽姑息治疗。比较两组的治疗效果。结果 观察组的治疗总有效率高于对照组(P<0.05)。治疗后,观察组的最大呼气流量
期刊
在经济向高质量发展转型的关键阶段,我国环境治理、生态保护和发展动力等方面也面临新要求。以政府为主体的政策方针为高质量发展提供了指引,以市场为主体的经济与环境效益为高质量发展提供了发展环境和约束环境,以企业为主体的利益诉求为高质量发展提供了创新驱动力。在追求经济高质量发展的现实背景下,环境规制是促进生态文明建设的重要保障,也是迈向环境友好型社会、可持续发展型经济的重要着力点。当前,推动环境规制体系建
学位
近年来经济全球化的深入迅速拉动我国出口贸易尤其是制造业贸易发展,制造业出口贸易对于我国经济高质量发展具有重要意义。然而,在我国制造业出口贸易规模逐步扩大的同时,出口贸易呈现出口量大但是出口质量不高的现状。因此,提升我国出口质量除了从制造业端发力,还需要制造业中投入的服务业资源的支撑。“十四五规划纲要”也指出,要大力发展服务型制造模式,促进传统制造业转型,其核心即是通过服务业推动我国制造业高质量发展
学位
深度越深、结构越复杂的深度卷积神经网络车型分类模型分析推断能力越准确,这必然对承载设备的存储和运算能力有很高的要求。车辆分类系统通常装载在关键路段的中小型设备上,硬件条件受到限制难以部署。研究神经网络模型剪枝是降低模型大小和计算量最直接有效的方法。本文主要对车型神经网络模型的压缩方法进行研究,研究的重点是在采用灵敏度分析下的范数和几何中位数剪枝算法,研究其在Cifar10公开数据模型及车型分类上的
学位
改革开放40多年来,中国积极参与社会主义现代化建设,经济增长迅速,经济实力显著提高,取得了举世瞩目的成就。在全国人民的共同努力下,2020年如期全面建成小康社会,但与之伴随的是污染物排放量增大,能源资源的消耗量显著增加,以牺牲环境资源为代价片面追求经济发展,对生态环境以及经济的可持续健康发展造成不可估量的负面影响。经济活动的负外部性、环境的公共物品属性所带来的市场失灵,造成严重的环境污染和生态破坏
学位
MP159高温合金作为航空涡轮发动机承力螺栓的必选材料,同时提高该合金的强度和塑性是航空领域亟待解决的关键工程问题。为了攻克MP159高温合金“强度-塑性相互掣肘”难题,本文首次提出采用液氮轧制技术对MP159高温合金进行深冷轧制,通过液氮轧制加工引入大量位错、层错以及形变纳米孪晶,从而解决了MP159高温合金的强度-塑性匹配问题,并采用XRD、EBSD以及HRTEM等表征方法探明MP159高温合
学位
为了满足日益增长的储能需求,世界各国研究人员对各种储能系统的研究不遗余力。作为一种新型的储能器件,超级电容器拥有较好的安全性、出色的循环稳定性以及更高的功率密度等优点,在较多储能应用上表现出独特的优势。由于电极材料存在不同的储能机理,选择合适的正负极材料组装出的超级电容器可以实现优异的电化学性能。基于这种思路,本论文主要研究两种不同储能类型的电极材料并且组装成混合超级电容器,具体内容如下:(1)碳
学位
孤独症谱系障碍是一种严重的神经发育类障碍,患者在临床上表现为社交技能缺陷、沟通交流障碍、兴趣狭隘及刻板重复的行为。目前孤独症谱系障碍的神经病理机制不明,脑功能连接研究认为该疾病与患者大脑各功能脑区之间的信息交流异常相关。人类大脑功能连接网络是频率依赖的,并有研究报道了孤独症谱系障碍不同频率下功能连接的改变,但对于功能连接的频率特性尚缺乏直接研究。因此,本论文利用ABIDE公开数据库中的105名孤独
学位
本文简述了快速凝固理论、相变理论、金属玻璃的结构特征以及分子动力学基本原理。采用分子动力学和EAM作用势模拟了AgNi液态合金的快速凝固,通过平均原子能量、双体分布函数(PDF)、最大标准团簇分析(La SCA)和配位数等方法详细地分析凝固过程的能量、体积及结构变化。本文的理论研究为改善AgNi合金的加工技术和性能改善具有一定的指导意义。研究表明:在1011 K/s冷速下,Ag50Ni50合金的凝
学位
<正>步入高年级,语文学习对学生的表达能力提出了更高的要求,语文园地中的词句段运用与单元整体目标高度契合,旨在结合单元课文创设情境,有针对性地提高学生对某一主题的表达能力。“词句段运用”是语言实操的一个训练点,它能将单元学习与能力提升有机结合。因此,教师应重视词句段模块的价值,搭建词句段学习构架,通过范例支架与实践支架,与单元课文进行多维关联,及时消化,引导学生学会自主运用,从而提高语言表达能力。
期刊