可翻译环状RNA的生物信息学工具开发和数据库构建

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:zble44
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物调节途径中起重要作用的环状RNA(circRNA)在许多物种中广泛存在,它是一种环状结构的RNA分子,没有3’和5’末端,不易被RNA酶降解,通过和微小RNA或小分子蛋白质之间的互作行使生物学功能,如作为微小RNA海绵等,其中部分circRNA序列还具有较高的保守性。如今,已发现越来越多的circRNA具有翻译能力,可以通过翻译产生细胞中的蛋白质,并在生物体的生长、发育和免疫反应等生物过程中起重要作用。正确鉴定具有翻译潜能的circRNA对于进一步研究具有重要意义。但是,目前缺乏识别其翻译潜力的软件。目前,随着高通量测序技术的发展和核糖体分析技术的出现,使高灵敏度地识别circRNA的翻译能力成为可能。在此,本论文开发了一种软件,用于根据核糖体分析数据识别circRNA的翻译潜力。为了测试CircCode的性能,我们收集了来自拟南芥和人的circRNAs数据集以及他们的核糖体图谱数据作为测试。最后,我们通过使用CircCode分别发现4651个在人类中可翻译circRNA和371个在植物中可翻译circRNA并分别进行了功能富集分析。CircCode是一个基于Python 3的框架,用于翻译circRNA(circRNA)鉴定。它也是一个简单而强大的基于命令行的软件。用户只需填写给定的配置文件并运行python脚本即可获得预测的翻译circRNA。它可以高正确率地从给定的候选circRNA数据库中鉴定出具有翻译能力的circRNA。该软件目前已发布在代码仓库GitHub(https://github.com/PSSUN/CircCode)上以供科研人员免费使用。此外,对于circRNA的下游分析及其数据的可视化,本研究开发了一款基于R语言的第三方包,Rcirc’,Rcirc是一款基于R语言的,用于对circRNA进行各种下游分析,以及进行可视化的R包。在CircCode的基础上,Rcirc不仅可以实现对circRNA翻译能力的预测。还包含了 circRNA的鉴定,特征分析(包括单独特征和集合特征)等重要功能。针对具有翻译潜力的circRNA,我们对其junction位点reads的匹配情况进行了独特的可视化,这使得借助Rcirc可以清楚地看到junction位点附近所有reads的匹配情况,包括reads分布情况,reads覆盖区域的每一个碱基类型,以及起始密码子和终止密码子的高亮等。此外借助可选参数可以实现对该区域进行放大和缩小等功能,具体的使用方式被发布在Rcirc的在线使用手册网站上(rcirc-doc.readthedocs.io/en/latest/),该 R 包同样存储在 GitHub 代码仓库中(https://github.com/PSSUN/Rcirc)。最后,基于利用CircCode鉴别出来的具有翻译能力的circRNA数据,我们建立了相关的翻译circRNA数据库TransCircDB(transcircdb.com),其中储存了包括人,小鼠,大鼠,鸡,拟南芥和玉米,水稻等十余个物种的翻译circRNA的序列信息和位置信息,供广大科研人员下载使用,同时TransCircDB支持多种在线生物信息学分析,包括circRNA的识别,翻译能力的鉴定,成环机制的整理,测序数据比对情况的可视化等在线工具,可以直接在网页上提交数据完成常规的分析,以上所有服务均免费提供。
其他文献
咳嗽是人体自身的一种具有保护性的反射动作,偶尔或轻微咳嗽可看做正常反应,不需要服用镇咳药。但咳嗽剧烈且频繁,影响患者的生活和健康时,则必须选用镇咳药,尤以能够迅速镇咳为最佳。杏苏止咳类方剂是常用的止咳祛痰药,现有的药物剂型以液体制剂和颗粒剂为主,其中,液体制剂所含的药物分散程度大,易引起一些化学成分的降解,同时液体制剂在携带、储存、运输方面多有不便。除此之外,液体制剂还容易产生物理稳定性等问题;而
学位
柴油机在商用车的中、重型车辆中作为主要动力使用,其动力性强、油耗低等优势较为突出,但是其排气污染物对大气环境的影响一直是国际社会重点研究的方向。我国柴油机从国IV排放标准阶段就开始就使用选择性催化还原技术(Selective Catalytic Reduction,SCR)方案来降低柴油机排放物中的氮氧化物(NOx)。国VI阶段的排放标准对排气污染物的控制提出了更高的要求,对NOx的转化效率要求更
学位
网络技术飞速发展,云计算和云存储已经成为Internet的基础服务。个人用户和企业用户愿意将自己的数据托管至云服务器存储。然而,外包给云服务器计算或者存储的数据面临着数据损毁和数据泄露的风险。用户选择对敏感数据进行加密,之后外包给云服务器,这一措施有效的保护数据隐私,但却对数据的使用造成障碍。可搜索加密技术的出现给解决这个问题提供有效途径,用户可以直接在加密数据上进行诸如搜索、计算等复杂操作。特别
学位
目的:本研究基于锆卟啉金属有机框架(ZrMOF)材料和荧光染料修饰的单链DNA分子(ss DNA),构建了一种用于简单、快速、超灵敏、高特异性检测核酸生物标志物的开关型荧光生物传感方法,为个人健康与公共安全提供技术保障。方法:本研究利用水热法合成了一种新型晶态多孔材料锆卟啉金属有机框架(ZrMOF)材料,并将其作为高效的荧光猝灭剂,以6-羧基荧光素染料(FAM)修饰的ss DNA序列(FAM-P1
学位
研究目的:角质形成细胞来源于外胚层,是表皮的主要细胞类型。小鼠是当前用于研究人类疾病最重要的模式生物,通过基因编辑技术,小鼠角质细胞正被广泛用于研究表皮屏障、瘢痕形成、银屑病等生理病理机制,具有广阔的应用前景。然而,目前文献中小鼠角质细胞的分离、培养方法各不相同,在体外传代过程中也很容易发生分化和衰老,亦存在贴壁困难、成纤维细胞污染等问题,大大影响了小鼠角质细胞的临床应用。因此,本研究拟对小鼠角质
学位
玉竹是百合科植物玉竹Polygonatum odoratum(Mill.)Druce的干燥根茎,为药食同源物质,具有养阴润燥、生津止渴功效,广泛用于药品、保健食品、化妆品等行业。玉竹资源辽阔,因生境不同使其成分有别,导致疗效差异。现代药学研究显示,玉竹中的四种高异黄烷酮(Ⅰ、Ⅲ、Ⅳ、Ⅴ),在抗癌、抑菌、抗氧化及对蛋白质非酶糖基化等方面具有较强生物活性,但2015年版《中国药典》一部,在玉竹活性成分
学位
学位
[目的]基因组大小(Genome Size)又称之为C值,是指生物单倍体基因组的DNA含量,是生物的特有属性。生物的形态、生理和行为等特征与基因组大小息息相关,而影响基因组大小最重要的原因是重复序列含量的差异。因此,重复序列的差异受到生物学家的广泛关注。全基因组测序显示,基因组大小与重复序列存在正相关关系。重复序列的差异也会造成真核生物之间基因组长度的差异,重复序列片段插入与缺失的相对频率是造成基
学位
燃料电池是高效能源转化装置,可缓解环境污染以及能源短缺的现状。然而其阴极氧还原反应(ORR)动力学慢,迫切需要研究高活性,高稳定性和低成本的无金属碳催化剂。结构可调,比表面积大,孔隙率高的金属-有机骨架(MOF)是无金属碳催化剂最合适的自牺牲前体。但Zn2+与含氮配体构筑的MOF衍生的碳材料是微孔主导的,限制了 ORR反应过程的传质。针对这一问题,本论文以Zn2+与多氮唑羧酸杂环配体合成的Zn-M
学位
荧光纳米材料顾名思义既具有优异的荧光性质又兼具纳米材料的优点,近年来深受研究者的青睐,并将其广泛应用于基础科学研究和多种生物应用。本论文旨在研究荧光纳米材料,充分利用两种典型的荧光纳米材料:荧光配位聚合物和金纳米团簇,分别探究其在生物传感方面的应用。首先,通过中心金属离子与聚集诱导发射(AIE)分子之间的配位作用,设计并构建了一种新型的以AIE分子为基础的配位聚合物纳米粒子,该纳米粒子的形成能抑制
学位