多物种长链非编码RNA的家族鉴定与特征分析

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:dannananjing31306111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】长链非编码RNA(lnc RNA)是指转录本大于200 nt但不翻译蛋白质的基因。在十几年前,lnc RNA等基因间区的非编码元件一度被认为是基因组中占据了极大区域的垃圾序列。伴随研究的不断深入,发现人类基因组高达80%的区域可以表达RNA,而这些被表达的非编码区域容易形成lnc RNA。虽然越来越多的lnc RNA被发现并被证实功能,但由于其演化速度快、序列保守性低、物种特异性高、部分lnc RNA无明显表型等特点,我们对这些基因的研究仍处于较初级的阶段。除了少数lnc RNA,如能影响人类X染色体失活的XIST有较为深入的研究外,对于大多数lnc RNA的功能仍待解析。【方法】新基因会通过整合进原有的信号及功能网络来获得功能,lnc RNA也可能通过类似的途径来获得它的功能。但是与蛋白质编码不同的是,lnc RNA会受到更低的选择压力与更高的遗传漂变压力。在这种条件下,lnc RNA会获得不定向的冗余功能,在特定的环境中发挥它的作用并受到纯化选择,随后形成保守的基因。因此对比蛋白质编码基因与lnc RNA的演化过程之间的异同点,将是研究lnc RNA功能的有效方法。【结果】然而,目前蛋白质编码基因和lnc RNA都没有可用的跨物种基因年龄推断的综合资源。因此,我们使用基于蛋白质家族的流程和Wanger简约算法系统性的确定了Ensembl和Ensembl Genomes数据库中的565个物种的9,102,113个蛋白质编码基因的演化枝,其中包括82种细菌,57种原生生物,134种真菌,58种植物,56种后生动物和178种脊椎动物。我们的时间树来自于化石证据基础与数千篇研究文章支撑的Time Tree数据库,并据此将基因的年龄从演化枝映射至百万年为单位的具体时间中。类似的,本研究使用本实验室收集的1862个RNA-seq样本,对来自硬骨脊椎动物(Euteleostomi)的18个物种的lnc RNA进行注释,并使用Blast N+Ortho MCL的方法进行同源物分析与基因家族推断,并将获得的基因年龄映射至时间树上。本研究评估了可能影响lnc RNA年龄推断的不同因素,包括测序手段与同源物推断方法所带来的影响。通过对比lnc RNA与蛋白质编码基因的年龄及其特征,本研究发现:1)基因特征分析显示lnc RNA序列在演化过程中的变得更加复杂;2)年老的lnc RNA与蛋白质编码基因在表达模式上存在分歧;3)年老的lnc RNA有更加复杂的转录调控行为;4)染色质位置状态分析表明lnc RNA具有独特的起源方式;5)具有旁系同源的人类特有lnc RNA更加富集功能特征。【结论】这些结果表明,lnc RNA具有十分独特的起源和演化方式,并且随着功能特征富集,lnc RNA会更加保守,受到更强的正选择效应,并改变周围的染色质状态。因此,本研究认为lnc RNA既不应该归类为蛋白质编码基因的退化产物,也不应该归类为de novo等方式产生蛋白质编码基因的中间产物,更不是蛋白质编码基因的附属物,而应该是一类具有独特且重要功能的基因组元件。另外,本研究中所有蛋白质编码基因的年龄数据都被编入Gen Origin(访问地址:http://genorigin.chenzxlab.cn/),这是一个用户友好的基因年龄估计新数据库,用户可以在其中按物种、年龄和基因本体浏览基因年龄估计,并比较各个资源中的基因年龄是否相同。在Gen Origin中,基因年龄估计、注释、基因本体、直向同源和旁系同源等信息,以及基于具有进化时间尺度的物种树的基因年龄推断的详细基因存在/不存在视图,提供给研究人员探索基因功能。
其他文献
茶氨酸是茶叶中最重要的促进健康的代谢物之一。耕地土壤中镉等有毒元素的生物活性增加导致其在植物组织中积累,进而通过食物链对人类健康造成严重威胁。茶氨酸被证实为一种新型的调节物质参与缓解盐、干旱等非生物胁迫,但茶氨酸调控植物镉胁迫生理机制尚不清楚。本研究利用转录组数据分析以及酵母互补试验鉴定了兼具吸收茶氨酸与镉的转运基因CsABCG11.2,采用水培试验模拟镉胁迫处理对拟南芥超表达株系进行功能分析,研
学位
茶是全球消费最广泛的非酒精饮料之一。在高温、强光等条件下,茶树幼嫩叶片容易积累花青苷,进而影响茶叶的适制性和品质,但其分子机制仍知之甚少。本研究利用RNA-seq技术对两组材料‘紫1’(Z1)和‘陕西紫阳种’(SZ)的夏季紫色叶片及其绿色叶片对照进行差异基因分析,结合qRT-PCR筛选得到一个关键基因CsGSTU18,探明了它在茶树花青苷转运过程中的关键作用,在此基础上以其启动子为诱饵进行酵母单杂
学位
环丙烷/氮杂环丙烷是天然产物和药物分子的重要结构基元,其三元环结构引起的环张力使其能够发生多种类型的反应,在合成化学、药物化学、生物技术等领域有广泛应用。目前,利用过渡金属催化烯烃的[2+1]环加成是合成环丙烷/氮杂环丙烷最直接、最高效地方法。因此,开发环丙烷/氮杂环丙烷化反应的高效催化体系显得极其重要。本课题组前期合成了系列含有分子内抓氢键类弱相互作用的[(BBN)Bpx]Cu(Ⅰ)配合物,并成
学位
含氮螺杂环在医药、农药、材料科学等领域应用广泛。其中,螺吲哚酮类化合物具有显著的抗病毒、抗菌、抗癌、抗疟和抗结核等功效。另一方面,螺苯并噁嗪衍生物具有抗惊厥、抗癌、抗炎等多种药物活性,并且还被用于热敏和光电材料的制备。鉴于其重要性,发展螺吲哚酮和螺苯并噁嗪类化合物的绿色高效合成新方法具有重要的研究价值。在此背景下,本论文探索并发展经由C-H键直接官能团化合成螺吲哚酮和螺苯并噁嗪类化合物的新方法。论
学位
有机含氟化合物在医药、材料等领域都有着非常广泛的应用。二氟甲基是一类非常重要的氟烷基,它含有一个氢原子,具有氢键供体的性质,含α-二氟甲基手性中心的小分子化合物可以和生物体内的手性受体更好地发生氢键的相互作用,提高分子的生物活性。因此发展直接高效地构建二氟甲基手性中心的方法具有重要的研究意义和应用价值。另一方面,有机硅化合物由于硅原子的独特性质和低毒性,是一类非常重要的有机合成子,并逐渐在药物化学
学位
考虑到活性硫的重要性,开发能够区分检测活性硫的荧光探针具有重要意义和迫切的需求。到目前为止,已经有一些分析方法用于检测分析特定的活性硫,如:高效液相色谱、毛细管电泳、质谱。然而,这些方法通常需要大量的样品或昂贵的仪器,此外,较长的检测时间也限制了这些方法的使用。小分子荧光探针因其自身结构具有可调控性,检测物质时响应灵敏、选择性好、损伤小以及可视化等特点,可用于环境中有害物质分析检测、细胞与组织成像
学位
喹唑啉是一类重要的在1,3-位含氮的稠环化合物。它广泛存在于各种包括抗癌抗肿瘤、抗菌、抗惊厥、抗结核等的具有生物药理活性有机分子中。目前已扩展至癌症治疗的一些药物中包含4-喹唑啉酮这一核心结构,且还具有催眠、镇静效用。同时,2,3-二氢喹唑啉-4(1H)-酮这一核心结构在许多天然药物分子中都含有,且此结构易被氧化成相应喹唑啉-4(3H)-酮衍生物。异噁唑类化合物也是一个研究热点,在天然药物和农业中
学位
铁氧化物是岩石与土壤的重要组成部分,是作物生长与粮食增产的营养来源,同时也可以作为中国土壤系统分类中的诊断指标。江西省土壤风化淋溶强烈、生物循环活跃,铁锰在B层相对富集,铁氧化物含量高。传统土壤铁氧化物实验室分析费时费力,操作步骤繁琐,已经不能满足现代智慧农业发展的需求。随着便携式土壤近端传感器的不断发展,提高了我们利用光谱信息在实地评估土壤状况的能力。便携式近端传感器在获取土壤光谱信息的过程中,
学位
非生物胁迫严重影响着植物的生长发育。其中干旱、高温和土地盐碱化是植物生长发育中面临最多的非生物胁迫。作为固着生长的生物,植物进化出精巧有序的应答机制来抵御非生物胁迫。狗牙根(Cynodon dactylon L.)作为暖季型草坪草中具有较高经济价值与生态价值的草种,广泛应用于运动场地、庭院、生态治理等各个方面。狗牙根对非生物胁迫有较好的抗性,但是如何感知并响应胁迫的分子机理研究较少,因此对其展开研
学位
野生莴苣(Lactuca serriola)是栽培莴苣(Lactuca sativa)的祖先,在莴苣的遗传改良中起着重要的作用,然而野生莴苣的散种(seed shattering)性状阻碍其种质资源的利用。莴苣在进化过程中由散种的野生莴苣进化为不散种的栽培莴苣,本研究想要通过正向遗传学的手段克隆控制莴苣散种的基因,为野生莴苣资源的利用提供理论依据。实验室前期利用Wo111×PI491245 F2散
学位