论文部分内容阅读
鹿类动物在生物多样性和生态系统中具有非常重要地位。由于生态环境的破坏、栖息地丧失和非法捕猎等因素的共同作用,其野生种群数量在急剧减少,有的甚至已经灭绝,许多鹿类动物已被列为濒危物种。河麂(Hydropotes inermis)等鹿类动物的保护还没有引起足够的重视。DNA条形码序列能够实现从一个未知样本到已知物种的鉴别,但这个目标的实现需要可靠的数学运算和分析方法。由于需要分类的生物类群不同或采用的DNA条形码基因位点及序列长度的不同,在物种识别能力和效果上存在一定的差异。我们以河麂保护为目的,对鹿类动物进行分子识别分析方法比较研究,为河麂等鹿类动物的皮毛、茸、肉等制品的鉴定提供基础依据。本研究的样本以粪便、毛发等无损伤取样为主,提取基因组DNA。以线粒体细胞色素C氧化酶亚单元I基因(COI)片段作为DNA条形码和细胞色素b基因标记识别河麂等鹿类动物,并进行河麂在鹿类动物的系统发育地位的分析。对鹿类动物的8个物种30个样本的COI基因和Cytb基因部分片段进行了测序,得到700bp的COI序列和792bp长度的Cytb基因序列。从GenBank和BOLD数据库下载了相关13个物种的43条COI序列,并以此作为DNA条形码参考序列。依据相关理论和算法对测序获得的COI序列样本进行分类指派分析,采用11种指派分析方法包括条形码空隙探查法、邻接树法、条形码逻辑公式算法、最近邻算法、决策树算法、规则RIPPER算法、随机森林法、支持向量机算法、神经网络反向传播算法、模糊数据算法、贝叶斯算法。结果显示,这些方法在鹿类动物分类中的解析能力和准确性存在较大差异。随机森林法和支持向量机法对鹿类动物DNA条形码分类最为可靠。综合分析各种因素,作者认为对各种方法表现性能影响最大的因素是分子数据多态性。通过增加基因位点、增加测序长度和样本量可以改进多数方法的预测性能,另外,选择对分类样本最适用的分析方法可以明显提高分析质量。为进一步探讨基因位点数和序列长度对识别效果的影响,以及为评估河麂的系统地位,我们将COI基因和Cytb基因合成1492bp长度的串联数据,采用最大似然法和贝叶斯法构建系统发育树。与单独采用COI基因构建的系统树相比,序列样本聚类关系基本一致,但置信值更高。河麂在鹿类动物中属于相对古老的物种,与狍的亲缘关系最近。本次研究有目的地采集了河麂的2个地理亚种样本,但物种识别分析和系统发育分析并没有将二者明显区分开,即未能将朝鲜河麂与华南河麂有效划分,这可能反映了DNA条形码分析在亚种级别的局限性,或这2个地理亚种分歧时间较晚。