论文部分内容阅读
精确的鸟类分类识别是鸟类学研究的基础。然而,一直沿用至今的形态学鉴别和传统比对算法各自存在一定局限性。近年来DNA条形码(Barcoding)技术在鸟类物种识别与分类方面起到了十分重要的促进作用。但是,以往的条形码鸟类物种识别主要参照基于CO I基因NJ树的拓扑结构。本文将显著性检验方法运用于鸟类条形码识别,给出序列相似性比对的统计学意义,弥补了传统比对算法的不足。
根据美国古生物学家辛普森提出的进化速率概率,论文提出了以科作为研究单位,假设科内的所有种具有相同或相似的进化速度,即在任意一个科内,衡量种内种间关系的距离界限是一致的。对每一科的序列,执行一系列的计算以建立距离分布数据库,包括导出fasta文件、数据预处理、序列比对对齐、计算距离矩阵及拟合分布函数。在距离分布数据库的基础上对未知序列进行鉴别。系统封装了数据分析的实现流程,提供了功能接口,便于操作,为鸟类的精确识别提供了一个方便快捷的工具。