论文部分内容阅读
煤炭作为工业之粮食,一直以来都是我国主体能源。近年来,我国正在大力推进煤炭供给侧改革,倡导发展清洁能源,煤炭消费比重不断下降。然而,我国富煤缺油少气的资源禀赋决定了,我国以煤炭为主体能源的基本格局在未来相当长的一段时期内难以改变。煤岩自动识别是一个公开的国际性难题,它是实现煤炭智能开采与加工的关键技术之一,它的突破有望使采煤机滚筒自动调高、综采放顶煤过程控制和选煤厂煤矸快速分选直接受益。传统的煤岩识别方法普遍存在效果欠佳、稳定性差、应用范围小等问题。鉴于煤岩的视觉差异明显,在国家自然科学基金(NO.51134024)、国家重点研发计划(NO.2016YFC0801800)以及国家高技术研究发展计划(国家863计划)(NO.2012AA062203)等经费的支持下,本研究从视觉计算的角度进行了煤岩识别新方法的一些有益探索,其主要贡献和创新点如下:1)提出了一种基于小波域非对称广义高斯分布统计模型的煤岩识别方法。首先,对煤岩图像进行多级离散小波变换,得到若干个中高频小波子带。然后,采用非对称广义高斯分布统计模型分别对这些子带的系数分布进行建模,通过最大似然估计得到模型的各个参数。最后,以推导得到的关于非对称广义高斯分布的相对熵表达式为相似性测度,完成煤岩类别判定。多组实验结果表明该方法所达到的准确识别率比其他同类方法更令人满意。鉴于此,对该方法作了进一步的改进,把离散小波变换换成了方向可选余地更大、旋转不变性更强的可控塔式分解。进一步的实验结果表明,改进后的煤岩识别方法在准确识别率方面比改进前有一定程度的提高。对于煤岩图像中高频小波子带或者可控方向子带的系数分布,采用非对称广义高斯分布统计建模是合理的。此外,实验结果还显示这两种煤岩识别方法均满足实时性要求。2)提出了一种基于双树复小波变换和广义伽玛分布统计模型的有效煤岩识别方法。首先,对煤岩图像进行多级双树复小波变换,得到若干个方向子带。接着,为了减少因样本发生旋转而引起方向子带相似性错位比对,提出了一种简单而又有效的旋转不变增强策略,即对每一级双树复小波变换产生的6个方向子带按绝对系数的均值和方差之积从大到小的顺序排列。然后,采用广义伽玛分布统计模型对这些子带的绝对系数进行建模,借助一种基于尺度独立形状估计方程的广义伽玛分布参数估计方法确定模型的各个参数。最后,以推导得到的关于广义伽玛分布的相对熵表达式为相似性测度,完成煤岩类别判定。多组交叉验证实验和随机抽样实验的结果均表明:与其他同类方法相比,该方法在准确识别率方面的表现更令人满意。旋转不变增强策略的提出和引入,一方面,有利于准确识别率的进一步提高,另一方面,使工程技术人员可以更加灵活地在准确识别率和运行时间、占用存储量这三者之间作出折中权衡。此外,实验结果还可以证实,对于煤岩图像双树复小波方向子带的绝对系数分布,采用广义伽玛分布统计建模是可行的。3)把最新的基于中值滤波的鲁棒扩展局部二值模式(RELBP)引入煤岩识别领域,由于面向类别判定的煤岩图像的RELBP各特征的重要程度分布具有不平衡性,也就是说面向类别判定的关于煤岩图像RELBP特征重要性的权重矩阵是结构化稀疏的,在分别推导最小二乘回归模型和正则化相关熵模型各自所涉及的优化问题求解的基础上,相继提出了一种通过最小二乘回归优选RELBP的有效煤岩识别方法和另一种基于RELBP和正则化相关熵模型的有效煤岩识别方法。首先,提取煤岩图像的多尺度RELBP原始特征向量。接着,基于训练样本的RELBP原始特征向量,建立一个最小二乘回归模型或者正则化相关熵模型,并通过求解该模型所涉及的优化问题获取能够尽可能地保持原始特征向量较强判别性的优选模式。然后,根据这些优选模式,从RELBP原始特征向量中抽取得到RELBP优选特征向量。最后,通过计算优选特征向量之间的χ~2距离来完成煤岩识别任务。多组交叉验证实验结果表明,这两种方法的准确识别率均高出绝大多数其他方法一大截,略高于直接采用RELBP原始特征向量进行煤岩识别的最新方法(记为RELBP方法)。多组随机抽样实验结果表明,在准确识别率方面,这两种方法和RELBP方法是基本相当的或者说是可比较的,但是与除此以外的其他方法相比还是高出不少。不得不提的是,与RELBP方法相比,这两种方法的占用存储量有不同程度的减少。最小二乘回归模型或者正则化相关熵模型所涉及的优化问题的求解比较耗时,然而它是在样本训练阶段的离线状态下完成的,因此不会对方法的实时性造成不利影响。4)虽然RELBP是一种很新的图像特征描述子,但是其参数设置有些繁琐、运算过程比较耗时。于是,把研究目光转向了另一种可判别性还算可以但运算速度更快的图像特征描述子——完备局部二值模式(CLBP)。如果按照默认的参数设置建议,那么提取得到的CLBP原始特征向量的维度非常高,远高于采用默认参数获得的RELBP原始特征向量。针对该问题,试图对煤岩图像的CLBP原始特征向量进行某些变换,先后提出了一种支持向量诱导字典学习CLBP的煤岩识别方法和另一种基于CLBP类别明确重构残差的煤岩识别方法。前者的基本流程为:首先,提取煤岩图像的多尺度CLBP特征向量;接着,在样本训练阶段,对已知类别训练样本的CLBP特征向量进行支持向量诱导字典学习,得到一组煤岩表征字典、煤岩类别权向量和偏移量,该过程的完成不仅要求训练样本CLBP特征向量的字典表示即编码向量具有一定的稀疏性,还要求它们尽可能地线性可分;然后,在样本测试阶段,计算测试样本CLBP特征向量对于煤岩表征字典的编码向量;最后,采用以煤岩类别权向量和偏移量为参数的线性判别函数完成对测试样本编码向量的类别判定。后者的基本流程为:首先,提取煤岩图像的多尺度CLBP特征向量;然后,在样本训练阶段,对已知类别训练样本的CLBP特征向量进行成对投影字典学习,得到多组类别明确的成对字典——综合型字典和解析型字典,其中每一种类别分别对应一组成对字典;最后,在样本测试阶段,分别采用各种类别对应的成对字典重构测试样本CLBP特征向量,把获得最小重构残差所采用的成对字典所对应的类别作为煤岩识别的最终结果。多组交叉验证实验和随机抽样实验的结果均表明,这两种方法的识别效果均好于其他方法。尤其在训练样本不充足的随机抽样实验条件下,它们仍然能够达到很高的准确识别率。尽管这这两种方法所涉及的支持向量诱导字典学习和成对投影字典学习都比较耗时,但它们都是在样本训练阶段完成的。因此,这两种方法是否满足实时性要求完全取决于CLBP特征提取和煤岩类别判定。多组实验结果显示,无论在交叉验证实验条件下还是在随机抽样实验条件下,这两种方法完全可以实时在线运行。此外,它们的占用存储量均与训练样本数量无关,这一优势在一定程度上给将来针对它们的硬件系统集成带来了便利,因为嵌入了这两种方法的硬件系统能够很好地适应训练样本数量随着时间推移会发生动态变化的工作场合。