论文部分内容阅读
R-语言免费、开源,提供了大量程序包,被称为科学家的第二语言。目前R语言中已经包括了不少可以应用于植物分类、形态与遗传变异式样分析的程序包。但是目前还很少有关于应用R语在这些领域中应用的研究报道。大灰藓(Hypnum plumaeforme Wilson)是一种分布广泛藓类植物,在系统分类、进化、分子生态学研究上具有重要的理论研究价值,在景观利用、环境指示、生理生态等领域也有广泛的应用价值。由于该种广泛的地理分布、多样的生境,复杂丰富的形态多样性,使其成为种下形态、遗传变异式样及其与环境关系研究上的合适材料。本文以浙江、福建境内的部分大灰藓14个群体、105份样本为研究材料,基于8个形态学性状和194个ISSR分子标记,借助于R语言中聚类、主成分分析、最小生成树等程序,搞清楚了研究区域大灰藓的形态和遗传变异式样,这些变异之间的相关性及其与地理背景,同时系统地介绍了R语言在藓类植物形态与遗传变异研究中的相关程序的使用方法。主要结论如下:(1)基于194个ISSR分子标记,应用Jaccard相似系数和组平均法为聚合策略,可以将105份大灰藓样本分成9个聚类群。(2)定量测定了105份标本的植物体分枝、茎叶尖、茎叶尖弯曲程度、茎叶纵褶、茎叶基部颜色、假鳞毛、茎叶角细胞形状、枝叶叶形这8个性状,以此为基础,应用Bray-Curits距离系数和离差平方和法聚类策略,可以将105份标本分成5个聚类群。(3)计算了研究对象地理距离与遗传距离、地理距离与形态距离,形态距离与遗传距离之间的相关系数,并直观地制作了反映以上变量之间关系的Shepard图。统计表明,基于ISSR分子标记的14个群体间遗传关系有一定的地理背景,105份样本的遗传距离与地理距离间的相关系数为0.369(n=14,P<0.2);但是105份样本之间的形态关系没有明显的遗传背景,形态距离与遗传距离间的相关系数仅为0.11(n=105,P<0.5);这种形态变异与地理距离之间没有对应性,两者的相关系数为0.107(n=14,P>0.5),即各样本间的形态变异并不受地理来源的影响,或者影响有限,可能更多的与小生境有关。(4)研究区域内的大灰藓的多态位点为192个,占总数194个的98.97%,Nei基因多样性指数为0.1768,Shannon信息指数为0.2899,群体总的遗传多样性为HT=0.1736,群体内的遗传多样性为Hs=0.0915,种群间遗传分化系数为Gst=0.4728,即47.28%的遗传变异存在于群体间,52.72%存在于群体内。(5)生境条件和地理隔离程序影响着大灰藓的遗传多样性。嵊泗县嵊泗本岛六井潭和嵊泗枸杞岛江爿湾生境特殊。其中枸杞岛是舟山群岛最东端的小岛,地理隔离程度高,而嵊泗本岛六井潭景区多为巨大砾石,环境条件差,生境单一,两群体的大灰藓的位点多态性低,分别为22.28%和19.69%,远低于14个群体的平均值33.23%,两者的基因多样性指数也低,分别为0.0577和0.0609,低于平均值的0.0909,Shannon多样性指数分别为0.0918和0.0942,低于平均值的1.444。在14个群体中,龙塘山群体具有最高的遗传多样性,该群体的多态位点百分率为58.03%,基因多样性指数为0.1379,Shannon信息指数为0.2264,均远高于平均值。龙塘山位于三清山国家级自然保护区的中心,生境多样,湿度高,环境条件好。(6)本文首次应用了同表型相关性分析、融合水平值图来确定苔藓植物聚类分析合适的聚类策略和分组数目,应用最适轮廓宽度值明确了不同分类对象归属度的合理性。在本研究的数据集中,发现以组平均法为理想的聚类策略,基于194个位点数据的105份大灰藓样本分为9组有严格的数学分析上的合理性,105份标本均正确地归并入相应的聚类组中。(7)双排表格热图和聚类结果重排距离矩阵热图也首次被应用于直观地表达分析苔藓植物样本间的遗传或形态分化关系。与基于形态数据的聚类结果重排距离矩阵热图相比,基于ISSR数据的热图更清楚地反映出105份样本在遗传上具有明确清楚地分化现象,而形态上区分的组间过渡性更明显。应用最小生成树、基于排序基础上的聚类分析均直观地表达了研究对象间的分组特点,展示了哪些类群具有相对特殊的遗传背景。(8)针对种群形态与遗传变异研究的需要,本文编辑了19个R语言程序,涉及到聚类分析、同表型相关系数、Shepard图、聚类融合水平值图、双排表格热图值、聚类分组、双排序表格热图、重排距离矩阵热图、圆形聚类图文件、主成分分析、三维排序图、组合聚类和排序的方法、最小生成树、形态-遗传-地理背景关系分析等,为今后同类研究提供了系统的R语言程序。