细菌sRNA靶标数据库3.0构建及其功能注释研究

来源 :中国人民解放军军事科学院 | 被引量 : 0次 | 上传用户:chenke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细菌s RNA是与多种生物学过程相关的重要调控RNA,例如新陈代谢、群体感应(quorum sensing)、生物膜形成、铁元素调控和毒力调节等。它们主要通过与靶标m RNA或者蛋白质结合发挥功能,因此,系统收集实验证实的细菌s RNA靶标,并开发相应的数据库管理分析系统,不仅可为深入了解s RNA功能和作用机制提供帮助,也可为开发细菌s RNA靶标预测模型提供支持。目前与细菌s RNA相关的数据库主要有s RNAMap、s RNAdb、Rfam、Regulon DB、NPInter、BSRD和s RNATar Base,这些数据库在数据收集与数据注释方面各有侧重。例如s RNAMap是一个革兰氏阴性细菌s RNA数据库,包含了来自70个微生物基因组的397个s RNA、62个s RNA转录因子和60个s RNA靶标。此外数据库还提供了s RNA的二级结构预测、s RNA表达条件和s RNA表达水平等信息。s RNAdb则是一个收集革兰氏阳性细菌s RNA的数据库平台,该数据库包括了558个革兰氏阳性细菌基因组和质粒、671个实验证实的细菌s RNA以及9993个预测的细菌s RNA,并可以对用户输入的s RNA数据进行分析,寻找其同源s RNA。Rfam数据库主要收集来自真核与原核生物的各种nc RNA家族,并提供二级结构信息,在细菌s RNA方面,主要收集相关s RNA序列信息,不涉及s RNA靶标。数据库Regulon DB则是一个关于大肠杆菌K-12中转录调控网络的数据库,其中包括转录单元(transcription units,TUs)、启动子和转录调控子(transcriptional regulators,TRs)等信息。该数据库收录了110个s RNA和227对s RNA-target相互作用,其中包含53个靶标m RNA结合位点。NPInter主要收集实验证实的非编码RNA(排除t RNA和r RNA)和其他生物分子(蛋白质、RNA和基因组DNA)的相互作用。NPInter v2.0含有201107个相互作用条目,涉及18个物种。其中包括32个细菌s RNA以及107个细菌s RNAtarget相互作用数据,但没有收录结合位点信息。BSRD是由Huang等人2013年开发的一个综合性的细菌s RNA数据库,它系统收集了细菌s RNA信息并整合了大量的注释信息。BSRD通过整合其他数据库信息和手工文献收集的方法共收集了897个实验证实的细菌s RNA、8248个s RNA同系物以及高通量测序数据预测得到的507个候选s RNA。在s RNA靶标方面,主要整合了s RNA预测靶标和s RNATar Base数据库提供的靶标信息。s RNATar Base是我们课题组2010年开发的一个实验证实的细菌s RNA靶标数据库。该数据库共收录数据392例,涉及17个细菌基因组,包含68个s RNA和227个靶标(或非靶标),特别是还包含了s RNA-m RNA相互作用结合位点信息。通过上述分析,可以看到,除了s RNATar Base,目前并没有数据库提供完整的细菌s RNA靶标信息,特别是没有s RNA-m RNA相互作用位点信息,不利于s RNA靶标m RNA预测模型的开发。其次,s RNATar Base数据库久未更新。为此,本课题拟在s RNATar Base的基础上构建全新的细菌s RNA靶标数据库,并在数据库的基础上开展功能注释研究。为构建一个数据全面、功能丰富的细菌s RNA靶标数据库,本研究采用三个策略进行数据收集工作:(1)根据NCBI基因组最新注释信息以及s RNATar Base2.0各条目的对应文献,对2.0版的392条数据进行全面校验和系统更新,如s RNA和靶标的NCBI识别编号链接、基因组位置、序列、各种位点坐标等信息。(2)采用不同关键词组合,例如bacterial s RNA target、bacterial small regulatory RNA target等,在Pub Med数据库中搜索细菌s RNA靶标相关文献,共得到在2010年1月1日-2015年6月1日之间发表的3124篇文献。根据摘要,从中筛选出120篇包含细菌s RNA靶标数据的文献,然后详细阅读这些文献并提取需要的s RNA-靶标信息和实验证据。(3)为防止靶标数据的遗漏,从所有细菌s RNA靶标预测工具的文献中提取s RNA-靶标数据集,并与数据库中的数据进行比对。最后,截至2015年6月1日,数据库共包含来自53个基因组的771个s RNA-靶标数据,其中有492个经实验证实细菌s RNA-靶标数据和279个无相互作用数据。数据库中包含752条s RNA-m RNA记录,和19条s RNA-蛋白质记录。此外,我们搭建了全新的数据库网站服务器,为用户提供更好的服务。数据库网站(http://ccb1.bmi.ac.cn/srnatarbase/)主要包括6个主要功能。(1)通过常见信息(s RNA信息、靶标信息、s RNA-靶标相互作用信息和实验证据)、序列(Blast功能)以及文献对数据库进行检索,同时还支持多条件组合查询。(2)RNA二级结构动态展示。(3)细菌s RNA-靶标相互作用的NCBI序列展示。(4)细菌s RNA-靶标调控网络展示。(5)基于s RNATarget和s Tar Picker靶标预测,并对得到的预测靶标进行功能富集分析。网站提供DAVID、GOEAST和PANTHER三个注释平台供用户选择。(6)进化分析(Phylogenetic analysis),用来检测s RNA-靶标相互作用在相近基因组中的保守性。在数据库中我们发现一些s RNA拥有多个靶标,一些靶标被多个s RNA调控。为了研究一个s RNA与一组靶标或一个靶标与一组s RNA之间的关系,我们开发了在线服务器Cos Tar,一个用于分析细菌s RNA靶标协同调控作用的分析工具。对于实验中产生的s RNA(或者基因)集合,例如在不同条件下差异表达基因集合,Cos Tar可以预测可能和它们相互作用的基因(或者s RNA)列表,从而对进一步的实验提供指导。我们从BSRD数据库中得到897个s RNA序列,从NCBI数据库中下载最新的细菌基因组序列。然后选取s RNATarge和s Tar Picker两种预测工具对选取的s RNA进行批量预测,将得到的结果按照统一的格式存入预测靶标数据库中。输入为一组s RNA时,我们采用统计学中的超几何分布来计算每一个m RNA的P值,依据P值对所有靶标进行排序。其中P值小于给定阈值的m RNA可以作为这一组s RNA的预测靶标。为方便相关研究人员的使用,我们还构建了在线分析服务器Cos Tar。综上所述,本文以细菌s RNA为中心,开展了两部分的工作:(1)我们成功地构建了细菌s RNA靶标数据库3.0。数据库共包含来自213篇文献的771条记录,其中实验证实的细菌s RNA-靶标数据有492个,结合位点有316个。与其他细菌s RNA数据库(Regulon DB、BSRD、s RNAMap和NPInter等)相比,s RNATar Base3.0不仅提供了最新最全的细菌s RNA靶标数据,同时还包含了316个结合位点数据以及实验中的突变信息。此外,全新的数据库网站提供了NCBI序列展示、s RNA调控网络、预测靶标及其GO注释和进化分析等各项功能,使得s RNATar Base3.0成为一个功能丰富的细菌s RNA靶标数据库。(2)我们成功构建了一个用于预测细菌s RNA-靶标协同调控作用的在线服务器Cos Tar。Cos Tar提供s RNA-Gene和Gene-s RNA两个功能,不仅能预测一组s RNA协同调控的靶标m RNA,还可以预测调控一组靶标m RNA的s RNA。该工作的主要特色与创新点有三个方面:(1)构建的细菌s RNA靶标数据库3.0拥有最为全面的细菌s RNA靶标数据,可以为相关研究(例如开发细菌s RNA靶标预测模型等)提供全面、准确的数据。(2)构建的数据库网站提供NCBI基因组展示、s RNA调控网络和GO分析等多种工具,可以从各个角度解读s RNA靶标数据,能够为相关研究人员提供帮助。(3)构建的Cos Tar在线分析工具是首次从协同调控角度分析细菌s RNA-靶标数据的工具,可以为相关人员提供帮助。
其他文献
[目 的]探讨可注射型富血小板纤维蛋白(i-PRF)应用于颞下颌关节骨关节炎的关节腔注射治疗方法与临床路径,为颞下颌关节骨关节炎的临床治疗提供理论参考。[方 法]根据纳入与排除标准,选择2019年9月至2020年1月就诊于昆明医科大学附属口腔医院颞下颌关节专科门诊并按照国内TMD分类标准诊断为骨关节炎的成年女性患者16例,年龄最大55岁,最小23岁。在椅旁采集患者静脉血,低速离心制备i-PRF并行
目的:评价与总结高血压病人饮食管理的最佳证据,为临床内科护理提供科学依据和支持。方法:计算机检索BMJ最佳临床实践、Up to Data,澳大利亚JBI(Joanna Briggs Institute, JBI)循证卫生保健中心数据库、美国国立指南库、the Cochrane Library、中国生物医学文献数据库、万方数据库、中国知网、医脉通、丁香园等数据库中关于高血压病人饮食管理的文献,检索时
学位
近1个月来,因全球防疫物资运输需求持续增长,以及国内复工复产运输需求的逐步恢复,上海机场集团管理运营的浦东机场日均货运航班达200多架次,已超过往年同期量值。据统计,仅防疫物资一项,浦东机场已累计运输1万多吨。根据国务院关于进一步快速提升我国国际航空货运能力、做好国际供应链保通保运保供的部署要求,上海机场集团多措并举,努力化危为机,尽最大努力发挥上海国际货运航空枢纽保障优势,利用构建的全球货运枢纽
期刊
本文着重分析《活着》一书中的主要女性形象,首先分析书中三个女性自我牺牲、无自我意识和无发声权利这些共同点,其次根据这些特点分析出作者这样塑造女性形象的用意,对传统高尚美德的致敬、对时代和女性悲剧命运的反思,最后分析作者心中真正渴望构建的女性形象。
对轨道交通车辆基地及周边土地进行综合开发利用,是提高城市土地资源集约利用水平、实现绿色低碳发展的客观需要,也是提高城市公共交通运行效率、缓解公共交通基础设施建设投融资压力的有效途径。通过对上海轨道交通17号线徐泾车辆段综合开发利用及建筑消防重难点的介绍与分析,为后续国内轨道交通车辆基地综合开发利用及其建筑消防设计提供相应的策略支撑和模式参考。
学位
移动计算、大数据等信息技术对教育的影响日趋明显,支持移动学习的软硬件设备系统有助于实现教学方式的改革突破。笔者借助希沃系统,以专业课课堂为主阵地,探索了汽修专业微移动学习方案的构建,以提升专业教学质量。1基于希沃方案的微移动教学方案构建希沃系统能促进学校教育信息化层级不断提升。它与中职教学诊改思想不谋而合,为中职专业课教学改进与技术方案的构建提供了思路。
期刊
学位
为从大蒜中萃取大蒜素,大蒜原料经去皮、破碎、冷冻干燥,并采用超临界CO2技术,通过单因素试验和正交试验考察大蒜素的萃取率。结果表明,影响萃取因素的主次顺序为萃取温度>萃取时间>萃取压力>大蒜粒度。得到的最佳萃取条件为萃取温度40℃、大蒜颗粒250μm、萃取压力10 MPa、萃取时间120 min。在此条件下进行验证试验,大蒜素的萃取率为76.45%。