论文部分内容阅读
五叶草莓(Fragaria pentaphylla Lozinsk)是蔷薇科蔷薇亚科草莓属的植物,也是中国特有的植物。本研究旨在筛选、鉴定草莓果色变化相关基因并初步探明其调控机理,为草莓果色领域的理论研究及增加果实商品性的草莓品种选育提供参考。研究人员通过野外搜寻,发现了两个典型的野生五叶草莓品种,其中一种五叶草莓果实在成熟后变为白色,另一种五叶草莓果实在成熟后变为红色。本研究通过二代高通量测序方法检测了野生五叶草莓七组共21个样本的转录组。通过RNA-Seq水平、lncRNA水平和共表达网络水平三个层次的生物信息学分析,筛选、鉴定到草莓果色变化相关基因/lncRNA并初步探明了野生五叶草莓转录调控水平果实颜色变化的机理,并得到以下结论:(一)明确了影响草莓果色变化相关基因的表达模式(1)通过rRNA去除法,提取草莓mRNA并构建全转录组测序文库,使用HiSeq 4000进行150 bp双端测序,质控后共获得了 206 G的Clean Data,平均每个样本9.8 G。(2)经过表达定量,对获得的差异表达基因进行GO及KEGG Pathway富集分析发现,差异表达的基因主要富集到次级代谢通路、植物病原菌互作代谢通路、苯丙素代谢通路及类黄酮代谢通路上。(二)RNA-seq技术探究IncRNA草莓果实发育及果色行程过程中的功能(1)经过严格筛选鉴定,选择转录本长度>=200bp、翻译后氨基酸数目小于100的转录本,并通过与公共数据库中非lncRNA及非mRNA类型的序列进行比较、过滤,然后利用NCBINR、Pfam、InterProscan等蛋白质数据库进行功能注释,过滤掉含有功能结构域的转录本,最后利用PLEK、CPC、FEElnc等软件进行编码潜能预测,最终确定30,393条候选lncRNA。(2)统计分析发现,候选lncRNA在不同材料中表达量差异较大,表达量范围为0~22666.18。多数候选lncRNA表达量较低且仅在一个样本表达,其中仅有2,526个lncRNA在所有样本中均检测到。(3)64个lncRNA仅在第三个发育阶段在全白草莓与白红草莓中呈现差异表达,而在该阶段白果(W)与红果(R)在果色方面存在巨大差异,这些特异差异表达的lncRNA可能参与了草莓的果色形成相关生物学过程的调控。(4)对差异表达lncRNA进行靶基因预测,并利用GO及KEGG进行靶基因功能富集分析。Trans作用靶基因预测结果显示,612差异表达lncRNA共鉴定到7,996个trans作用靶基因,构成了 86,754个表达高度相关的lncRNA-target对。部分lncRNA靶向同时多个靶基因,而部分靶基因也被多个lncRNA同时靶向。针对可以定位于参考基因组的lncRNA,利用其位置信息进行cis作用靶基因预测,共有2,228个lncRNA成功的预测到了靶基因,lncRNA多数位于基因间隔区(约72.71%),而相对较少的lncRNA位于基因内进行靶向调控作用。(5)针对差异表达lncRNA靶基因功能注释,共检测到30个靶基因参与了苯基丙酸类合成路径,包括4-香豆酸辅酶A连接酶,β-葡萄糖苷酶,肉桂醇脱氢酶,过氧化物酶,咖啡酸-O-甲基转移酶,松柏醛脱氢酶。(三)果实发育及果色形成相关基因表达调控网络构建(1)针对参与植物生物及非生物胁迫相应过程中的PR10家族蛋白进行分析,共鉴定出29个PR10家族成员,均包含PR10家族保守功能结构域Bet_v1-like(cd07816)。多序列比对分析进一步揭示的PR10蛋白质家族成员间的差异性,除TRINITY_DN49653_c0_g2、MSTRG.5876、TRINITY_DN118165_c0_g1 外,其他 PR10家族成员均包含高度保守的富甘氨酸loop基序EG(D/N)GG(V/P)G(T/S)。其中与已报道参与类黄酮物质合成相关的Fraa 1E高度同源的TRINITY_DN111701_c0_g3、MSTRG.13759在W与R中呈现显著差异表达,且在红果(R)中表达丰度较高,在三个发育阶段差异倍数范围为1.46~5.12。草莓PR10蛋白质能够与花青素合成过程中的中间代谢产物结合,影响花青素合成,可能是调控草莓果色形成的主要调控因子之。(2)功能注释分析结果显示在草莓果实发育的三个阶段中W与R差异基因在植物与病菌互作、脂肪酸代谢途径中显著富集。模块MEpink中的基因功能富集分析揭示了该模块中的基因主要参与了脂肪酸代谢途径与蜡质层生物合成途径,共检测到9个基因参与其中,其代谢产物主要用于下游角质、蜡质合成。本研究中在W_vs._R比较组中分别鉴定出7个脂肪酸链延长相关、7个角质层、蜡质形成相关显著差异表达的基因。上述基因在两个材料的草莓果实发育过程中呈现持续差异表达,参与了草莓角质层、蜡质形成过程,影响草莓抗性及储藏加工品质,为后续研究草莓抗性机制打下一定的研究基础。(3)通过共表达网络构建、蛋白质与蛋白质互作分析、miRNA-mRNA、miRNA-lncRNA、lncRNA-mRNA靶向预测等方法构建了复杂的草莓果实发育、果色形成相关的分子调控网络,构建了包含20,770个基因的蛋白质互作网络。在该蛋白质互作网络中存在“一对一”、“一对多”、“多对多”等形式,共获得了 2.8 M的蛋白质互作对。结果揭示了 lncRNA可以通过多种作用方式参与草莓果实发育、果色形成过程的调控,同时也鉴定出部分功能未知的基因参与了上述过程,进一步研究这些基因的功能将有利于解析草莓果实发育、果色形成相关的分子调控网络。