论文部分内容阅读
自1995年流感嗜血杆菌的全基因组序列首次被测定到现在,共有578个物种的全基因组测序已经完成,比较基因组学也成为生命科学研究最重要的策略与手段之一。人、小鼠和大鼠的全基因组比较发现,这三个物种间存在着5425条长于100bp的完全匹配的超保守序列。这些序列承受了很强的进化选择压力而保存了下来,被普遍认为具有重要的生物学功能。
本论文的研究内容是目前已完成测序的全部三种高等植物:拟南芥、水稻和杨树。在用Repeatmasker去掉低复杂度重复序列之后,我们用MUMmer程序对这三个物种进行了全基因组比较。在拟南芥和水稻四个亚种之间我们共探测到424条长于40bp的超保守序列,我们将其定位到拟南芥的染色体上,发现有75%的超保守序列(318条)与已经注释的外显子有重叠,另外106条落在非编码区(包括基因间区域和内含子),其中有10条已注释为小核RNA,其余96条目前尚无报道。对这96条序列,我们用RNAfold进行了二级结构折叠,尽管有13条序列最小自由能的Z-score计算显示出统计上的差异,但我们没有发现明显特征的RNA二级结构。我们还将所有的超保守序列用Gbrowse进行了全基因组可视化处理,便于直观地研究。
将拟南芥和水稻间的超保守序列与杨树的全基因组比对后,我们发现有72条序列在杨树的基因组中可以找到完全匹配的序列。这些比对工作以及比对结果的分析对于进一步探测超保守序列的功能具有重要的意义。