论文部分内容阅读
随着全球森林资源的急剧减少以及木材非法采伐和贸易活动的加剧,热带木材物种已迅速成为《濒危野生动植物种国际贸易公约》(CITES)关注的焦点,加强热带木材进出口监管成为我国CITES履约工作面临的一项严峻挑战。科学准确地识别木材树种,是保护全球木材资源、促进我国木材进出口贸易健康发展的重要途径。
本论文为揭示木材种间水平上内在特征的变化规律这一科学问题,解决传统木材解剖学无法实现“种”的识别这一难题,以黄檀属(Dalbergia spp.)和紫檀属(Pterocarpus spp.)木材为研究对象,通过机器学习方法(Machine Learning Approaches,MLAs),分别开展了木材定量解剖、DNA条形码和计算机视觉的木材识别研究,阐明了木材内在特征在种间的变化规律,为实现木材在“种”水平的准确识别和履行CITES国际公约提供科学依据。主要结果归纳如下:
(1)木材宏观和微观构造特征:8种黄檀属木材在颜色、纹理等宏观构造特征以及管孔、轴向薄壁组织和木射线等微观构造特征上都显示出较高的相似性;东非黑黄檀(D.melanoxylon)在木材颜色和木射线宽度上与其他7种木材具有比较明显差异;在6种紫檀属木材宏观和微观构造中,安哥拉紫檀(P.angolensis)、印度紫檀(P.indicus)和大果紫檀(P.macrocarpus)表现出较高的相似性,檀香紫檀(P.santalinus)和染料紫檀(P.tinctorius)显示出极高的相似性,非洲紫檀(P.soyauxii)与其他几种紫檀属木材在轴向薄壁组织上显示出差异性。基于木材宏观和微观构造特征,难以实现8种黄檀属和6种紫檀属木材在“种”水平的准确鉴别。
(2)木材定量解剖识别:朴素贝叶斯算法Na(i)ve Bayes可以将东非黑黄檀和非洲紫檀完全正确分类。决策树分类器J48可以将阔叶黄檀(D.latifolia)、东非黑黄檀和降香黄植(D.odorifera)从8种黄檀属木材中区分出来,将非洲紫檀从6种紫檀属木材中分辨出来。支持向量机分类器SMO可以对交趾黄檀(D.cochinchinensis)、黄檀(D.hupeana)、阔叶黄檀、东非黑黄檀、降香黄檀和奥氏黄檀(D.oliveri)进行正确分类;并将安哥拉紫檀、印度紫檀、大果紫檀和非洲紫檀成功判别。规则学习算法Jrip可将东非黑黄檀、降香黄檀和奥氏黄檀正确分类;大果紫檀和非洲紫檀也被成功判别。在四种机器学习算法中,支持向量机显示出最高的木材识别成功率,分别为95%(8种黄檀属)和93.3%(6种紫檀属)。
(3)木材DNA条形码识别:针对8种黄檀属木材,通过比较分析候选DNA条形码的序列特征、种内种间距离以及采用TaxonDNA和NJ树等方法获得的识别成功率,条形码组合ITS2+trnH-psbA被筛选出作为鉴别8种黄檀属木材的最佳条形码组合。机器学习方法(BLOG和WEKA)分析结果表明,支持向量机算法(SMO)识别成功率最高,优于TaxonDNA和NJ树;BLOG、J48和Jrip等算法也获得了较高的识别成功率,而且产生了适用于木材识别的逻辑和决策规则,简单易懂。同时,通过机器学习方法也成功实现了对非凭证标本的准确识别。另一方面,采用TaxonDNA和NJ树方法,均无法成功鉴别6种紫檀属木材。而采用机器学习算法SMO,仅通过二个条形码组合(ITS2+matK)就可以成功区分6种紫檀属木材,优于原有的三个条形码组合(matK+ITS2+ndhF-rpl32)。基于机器学习方法和微型DNA条形码ndhF-rpl32,可以成功区分檀香紫檀和染料紫檀。在木材DNA条形码识别中,机器学习方法获得的识别成功率优于TaxonDNA和NJ树,并提高了DNA条形码的识别效率。
(4)木材计算机视觉识别:采用Xylotron图像采集装置采集形成了包括15种黄檀属和11种紫檀属共10237张图片的横切面构造图像数据库;通过卷积神经网络(Convolutional Neural Network,CNN)分别构建了VGG16和AlexNet深度学习算法模型,并对模型进行训练和测试。VGG16算法模型对14种黄檀属木材的识别精度为85.44%,对11种紫檀属木材的识别精度为65.44%。该模型可以准确识别绒毛黄檀、奥氏黄檀、黄檀、印度黄檀、东非黑黄檀、巴西黑黄檀和伯利兹黄檀等7种黄檀属木材以及紫檀属中的非洲紫檀。AlexNet算法模型对15种黄檀属和11种紫檀属木材的识别精度为99.34%,其中12种黄檀属和7种紫檀属木材的识别成功率达到了100%,明显优于VGG16算法模型,可以直接应用于对黄檀属和紫檀属木材的鉴别。同时,本研究确立了AlexNet深度学习模型参数体系,每个树种应具有10块以上木材标本,每个树种采集100张以上高质量木材构造图像,设置图块至少大于1000×1000×3,深度学习模型将获得较高的识别精度,可以实现黄檀属和紫檀属濒危与珍贵木材在“种”水平的快速准确识别。
因此,将机器学习算法引入木材定量解剖、DNA条形码和计算机视觉等识别方法中,阐明了木材在种间水平上内在特征的变化规律,实现了木材在“种”水平的准确快速识别,为打击木材非法采伐、履行CITES公约提供科学依据和技术支撑。
本论文为揭示木材种间水平上内在特征的变化规律这一科学问题,解决传统木材解剖学无法实现“种”的识别这一难题,以黄檀属(Dalbergia spp.)和紫檀属(Pterocarpus spp.)木材为研究对象,通过机器学习方法(Machine Learning Approaches,MLAs),分别开展了木材定量解剖、DNA条形码和计算机视觉的木材识别研究,阐明了木材内在特征在种间的变化规律,为实现木材在“种”水平的准确识别和履行CITES国际公约提供科学依据。主要结果归纳如下:
(1)木材宏观和微观构造特征:8种黄檀属木材在颜色、纹理等宏观构造特征以及管孔、轴向薄壁组织和木射线等微观构造特征上都显示出较高的相似性;东非黑黄檀(D.melanoxylon)在木材颜色和木射线宽度上与其他7种木材具有比较明显差异;在6种紫檀属木材宏观和微观构造中,安哥拉紫檀(P.angolensis)、印度紫檀(P.indicus)和大果紫檀(P.macrocarpus)表现出较高的相似性,檀香紫檀(P.santalinus)和染料紫檀(P.tinctorius)显示出极高的相似性,非洲紫檀(P.soyauxii)与其他几种紫檀属木材在轴向薄壁组织上显示出差异性。基于木材宏观和微观构造特征,难以实现8种黄檀属和6种紫檀属木材在“种”水平的准确鉴别。
(2)木材定量解剖识别:朴素贝叶斯算法Na(i)ve Bayes可以将东非黑黄檀和非洲紫檀完全正确分类。决策树分类器J48可以将阔叶黄檀(D.latifolia)、东非黑黄檀和降香黄植(D.odorifera)从8种黄檀属木材中区分出来,将非洲紫檀从6种紫檀属木材中分辨出来。支持向量机分类器SMO可以对交趾黄檀(D.cochinchinensis)、黄檀(D.hupeana)、阔叶黄檀、东非黑黄檀、降香黄檀和奥氏黄檀(D.oliveri)进行正确分类;并将安哥拉紫檀、印度紫檀、大果紫檀和非洲紫檀成功判别。规则学习算法Jrip可将东非黑黄檀、降香黄檀和奥氏黄檀正确分类;大果紫檀和非洲紫檀也被成功判别。在四种机器学习算法中,支持向量机显示出最高的木材识别成功率,分别为95%(8种黄檀属)和93.3%(6种紫檀属)。
(3)木材DNA条形码识别:针对8种黄檀属木材,通过比较分析候选DNA条形码的序列特征、种内种间距离以及采用TaxonDNA和NJ树等方法获得的识别成功率,条形码组合ITS2+trnH-psbA被筛选出作为鉴别8种黄檀属木材的最佳条形码组合。机器学习方法(BLOG和WEKA)分析结果表明,支持向量机算法(SMO)识别成功率最高,优于TaxonDNA和NJ树;BLOG、J48和Jrip等算法也获得了较高的识别成功率,而且产生了适用于木材识别的逻辑和决策规则,简单易懂。同时,通过机器学习方法也成功实现了对非凭证标本的准确识别。另一方面,采用TaxonDNA和NJ树方法,均无法成功鉴别6种紫檀属木材。而采用机器学习算法SMO,仅通过二个条形码组合(ITS2+matK)就可以成功区分6种紫檀属木材,优于原有的三个条形码组合(matK+ITS2+ndhF-rpl32)。基于机器学习方法和微型DNA条形码ndhF-rpl32,可以成功区分檀香紫檀和染料紫檀。在木材DNA条形码识别中,机器学习方法获得的识别成功率优于TaxonDNA和NJ树,并提高了DNA条形码的识别效率。
(4)木材计算机视觉识别:采用Xylotron图像采集装置采集形成了包括15种黄檀属和11种紫檀属共10237张图片的横切面构造图像数据库;通过卷积神经网络(Convolutional Neural Network,CNN)分别构建了VGG16和AlexNet深度学习算法模型,并对模型进行训练和测试。VGG16算法模型对14种黄檀属木材的识别精度为85.44%,对11种紫檀属木材的识别精度为65.44%。该模型可以准确识别绒毛黄檀、奥氏黄檀、黄檀、印度黄檀、东非黑黄檀、巴西黑黄檀和伯利兹黄檀等7种黄檀属木材以及紫檀属中的非洲紫檀。AlexNet算法模型对15种黄檀属和11种紫檀属木材的识别精度为99.34%,其中12种黄檀属和7种紫檀属木材的识别成功率达到了100%,明显优于VGG16算法模型,可以直接应用于对黄檀属和紫檀属木材的鉴别。同时,本研究确立了AlexNet深度学习模型参数体系,每个树种应具有10块以上木材标本,每个树种采集100张以上高质量木材构造图像,设置图块至少大于1000×1000×3,深度学习模型将获得较高的识别精度,可以实现黄檀属和紫檀属濒危与珍贵木材在“种”水平的快速准确识别。
因此,将机器学习算法引入木材定量解剖、DNA条形码和计算机视觉等识别方法中,阐明了木材在种间水平上内在特征的变化规律,实现了木材在“种”水平的准确快速识别,为打击木材非法采伐、履行CITES公约提供科学依据和技术支撑。