论文部分内容阅读
小RNA是近年来新发现的非编码RNA,通过形成RISC复合体作用于目标序列在转录和翻译水平调节基因,进而影响着发育定时、抗病毒防御、基因组重排、染色体修饰等生物过程。目前在拟南芥、水稻等高等植物中都有大量胁迫响应方面的研究,但是单细胞藻类衣藻中一直没有关于小RNA和胁迫关系的报导。
本课题中,我们借助高通量测序探索了这一联系,并进行了后继的生物信息学分析和实验验证。衣藻细胞在缺硫、缺磷、缺铜、铜过量、强光照、高二氧化碳、黑暗共7种情况下培养,并以TAP和HS培养液中的细胞作为对照,然后用于Solexa测序。去除样品准备时引入的载体之后,原始数据被按照长度过滤并且检测数据质量。这一步预处理说明,大多数样品测序时产生序列都超过400万条。其它支持数据质量的参数还包括比对到基因组上的序列比例(多于40%)、典型小RNA长度~20-22nt处的富集程度(>84%)、比对到miRNA前体和基因组重复序列区的序列含量(分别超过14%和30%)。
剩余的序列用于我们实验室内的miRNA预测工具,这一工具对高拷贝和有链主导优势的序列进行扩展以找到满意的二级结构。该过程中发现了34个可能的miRNA,其中2个有miRNA*。对其热力学稳定性作随机检验表明,衣藻的新miRNA并不像动物中那样有p值数值的倾向性。对新发现的miRNA使用传统的靶基因预测方法,我们发现了对应着19个miRNA的54个注释的靶基因。这些靶基因分为三类,即转录因子(如EF-3)、各种酶(如甲基化转移酶)、以及直接起作用的分子(如鞭毛相关蛋白)。
小RNA的表达特点则从三个角度探讨,并且该过程中强调对miRNA的分析。使用UPGMA算法,我们把miRNA富集量层次聚类为5类(TAP对照)和6类(HS对照)。接着,实验组和对照组之间还进行了两两比较。另外,借助一种称作对应分析的统计方法,我们发现了数十个可能的根据胁迫特异性表达的miRNA。而对于siRNA,作出的基因组分布图在样本间呈现出相似的表达轮廓,这也和进一步的相关性分析相一致(相关系数~0.70-0.96)。
我们还对miRNA表达变化作了实验验证,并使用一种先进的技术(降解组测序)确认了部分miRNA靶基因,该技术通过深度测序抓取和定量切割片段。Northern Blot用于缺磷时上升的miRNA杂交,实验中发现cr.057241、cr.05507_2、cre-miR912三者过表达;从有限的注释资源了解到,它们的靶基因参与蛋白质修饰、鞭毛运动和氮代谢。此外,降解组测序提供了另一种理解miRNA切割的角度;在检测出的19个切割位点中,有一些和RNA解旋酶、甲基化转移酶、alpha微管蛋白等蛋白质的mRNA有关,虽然其它的大部分都没有注释。
我们课题的价值在于,能够作为探索藻类中小RNA和环境因素联系的先导项目,而且可以作为记录miRNA变化与胁迫条件关联的数据来源,其中的数据有望被用于对miRNA详细功能的进一步实验研究。