论文部分内容阅读
计算机辅助卷烟配方设计作为一项信息技术和配方技术相结合的边缘性的研究课题,到目前为止尚没有统一的概念、理论框架和技术体系。最近几年,随着烟草企业联合重组步伐的加快、品牌集中度的提高以及对安全性的严格要求,对烟叶原料资源的整合与深度利用、传统的配方研发与质量控制模式、产品多点生产的均质化控制能力都提出了严峻的挑战。本文在前期多年研究的基础上,立足于工程实践中遇到的新的难点技术问题和一些新的挑战,以计算机辅助卷烟配方设计为工程背景,从机器学习和模式识别工程的视角审视了模式识别技术和归纳推理机制存在的一些缺陷,并针对实际应用给出了新的方法。本文从辅助配方设计的基本原理分析入手,围绕原料相似性度量、卷烟质量评价以及卷烟分类器预测控制三个关键技术方法,开展了深入研究。本文主要研究内容概述如下:1、在概述计算机辅助卷烟配方设计国内外研究现状和领域问题复杂性分析的基础上,鉴于该研究领域缺乏统一概念、技术框架的研究现状,本文分析给出了计算机辅助卷烟配方设计的基本原理、基本特征、技术目标,以及从烟草和计算机技术两个角度的技术体系框架,并在部分关键技术上进行了分析,期望能对该领域的研究人员以及企业界更清晰的把握研究内容和预期提供参考。本文还指出了计算机辅助卷烟质量评价是解决辅助配方设计的一项核心工作,模拟质量评价的优劣直接影响到配方组合优化设计中配方方案的筛选效果。2、针对原料相似性度量中“距离失效”问题,本文从“维数灾难”的数学分析、几何理解、高维空间点间距离一致性等角度分析了“距离失效”的本质原因。在对流形学习的局部线性嵌入(LLE)算法研究基础上,针对烟草质量数据样本点稀疏、局部非线性、不光滑等数据特性,以及原料相似性度量要求低维空间保距映射的特征,提出了基于核变换测地距离的LLE改进算法(KGLLE),详细分析了KGLLE算法的设计思想和过程,并用KGLLE算法解决了高维空间原料相似性度量存在的问题。3、面对工程实践中遇到的专家经验或领域知识难以融入分类器、专家被动接受分类器预测结果等实际问题,本文从模式识别推理机制的角度分析了“归纳推理”的缺陷,以及目前主流分类器对解决上述问题的“有心无力”,继而在转导推理一致性预测器框架基础上提出了核化K邻域度量的一致性预测器(CP-KKNN),并在Iris数据集和卷烟焦油数据上进行了实验验证,取得了良好的分类效果;同时也分析指出了一致性预测器对解决卷烟质量模式识别这类工程问题具有很高的应用价值。4、在分析当前主流分类器预测时出现盲目的、机械的预测错误基础上,本文在仿生模式识别“认识”和“覆盖”理念的指导下,综合集成假设检验、凸壳构造与内点分析、序列随机性检验等理论和方法,设计提出了具有拒绝识别和可信度分析特征的分类器预测控制算法(RC-PC),并在卷烟香型SVM分类器上实验验证了算法对降低预测错误率的实际效果。研究表明如果把模式识别预测环节作为研究重点的话,对改善实际工程应用效果将优于改进分类器算法。5、简要分析了多技术集成的辅助配方设计在软件系统层面应解决的主要问题,并给出了系统的设计目标、设计指导思想、四层框架结构以及在智能化系统中算法选择的一般性原则等。最后给出了两张系统截图,旨在期望更多的模式识别或机器学习研究人员投身到工程实践中,从实践中寻找创新之源。6、总结了本文的主要创新性工作和研究结论,并从数据集结构分析、预测器构造、凸壳研究以及辅助卷烟配方设计四个方面展望了今后的研究方向。