论文部分内容阅读
分子群体遗传学研究的特点是取样量大--存在于群体样本中的遗传变异必须要充分代表该群体和该物种的遗传变异量及分析的位点数多--位点样本必须恰当代表基因组.大样本的群体取样和位点取样产生大量的原始数据,使原始数据人工处理非常困难甚至不可能,从而迫切需要原始数据处理的自动化.目前一些大公司提供的凝胶图像收集仪器和配套的软件已经使原始数据的获取基本上自动化或半自动化.获得DNA片段分子量数据后,必须把这些分子量数据转变成可反映操作单位(样本)之间关系的数据矩阵,原来用于计算分子量的那些软件已不实用或派不上用场.目前,除了用于fAFLP的Binthere弥补了部分不足外,还没有此类软件.Binthere存在固定栏宽(Bin)的缺陷,也就是将分子量最大值与最小值之间等分的方法来归纳不同操作单位(OUT)之间的异同,使得分子量绝对值差很小的数据可能被归入不同的栏,导致结果不正确.为了解决这类问题,我们设计编写了一个新的软件,取名为Matrix Generator(MG).与同类软件相比,MG具有两个主要优点:(1)采用动态栏宽和智能归并算法,克服了固定栏宽可能造成的错误;(2)可用于非荧光标记的分子标记技术.MG的基本思路是:分子量差异越小的片段,越可能是同缘片段,越应该处于相同的栏内.为此,我们采用绝对对应的动态过程.也就是说,从最小分子量到最大分子量之间的栏目数不是事先确定,而是由所分析的所有样品的特点和所使用的凝胶的分辨率(用户根据凝胶的特点给出数值)决定的.当两片段的差异小于凝胶所能达到的分辨率时,两片段被认为是同缘片段而归入相同的栏内.归并的过程从差异最小值开始,直至任意两片段的差异都大于凝胶的分辨率为止.这样就排除了同缘片段被隔离或者非同缘片段被合并的错误,从而使最可能同缘的片段归结在同一位点.MG第一版(V1.0,DOS版)集中体现了实用和易用的优点而没有包含同类软件所具有的一些功能,所以MG必须与其他软件结合使用.对于非荧光标记的分子标记技术,如RAPD、RFLP、AFLP等,可用Quantity One等软件得到分子量,用Excel生成样品与(分子量数据代表的)DNA片段矩阵,然后用MG处理.对于荧光标记的分子标记技术,如fAFLP、fSSR等,除可以用Excel生成矩阵外,可直接用Binthere和Genotyper等生成分子量矩阵,然后用MG处理.MG输出的矩阵经过适当编辑后,就可用后续的软件如Paup、Ntsys、Philip等运算.为了检验MG的有效性,我们用六道木属(Abelia)的AFLP分析数据进行检验,14个样品的DNA片段分别用Binthere和MG进行处理.前者得到295个含信息的位点,后者得到210个含信息的位点.用Nei and Li(1979)的算法分别计算距离矩阵并对两距离矩阵作Mantel检验.结果,两矩阵之间存在一定的差别,但相似性系数高达0.941 63,说明两种方法总体上会得到相似的结果,但局部会有所不同.用Paup对两矩阵作进一步分析,生成两个Neighbor-joining(NJ)树.结果表明,MG生成的数据更符合实际情况,而且分辨率高.