基于聚类和加权K近邻的烟叶分级研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:meimeini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
烟叶收购阶段,正确客观的划分烟叶等级既可提高烟农的种植积极性,又可保障卷烟企业的经济利益。现阶段的人工分级存在主观性强、人力和物力耗费大等缺点,针对同一片烟叶,不同的专家有可能将它划分到不同的等级。因此,客观、快速、高准确率的智能分级是迫切需要的。目前,烟叶智能分级的研究集中在基于烟叶图像和红外光谱进行分级两个方面。由于烟叶的光谱特征可以更好地反映含油量、色度、身份及成熟度等与烟叶等级密切相关的因素,所以本文基于光谱对烟叶分级进行了研究。烟叶智能分级系统的识别率和整体速度与所选择的分级模型和样本特征光谱的采集量存在很大的关系,为实现一个具有高识别率的实时烟叶智能分级系统本文主要进行了以下工作:1.烟叶光谱的采集、预处理和孤立样本的检测。利用型号为UV-3600的光谱仪采集642(13个等级)片烟叶的反射光谱;为降低基线漂移所带来的噪声和特征值间的差异对分级的影响,对光谱进行了归一化处理;由于可能存在错分类别的样本(孤立样本),所以需要对构建分级模型的样本训练集进行选择。本文分别利用夹角余弦距离、欧氏距离和相关系数法并通过统计分析选择合适的阈值检测各个等级中的孤立样本和确定用于建立分级模型的样本训练集。2.分级模型的构建以及K近邻算法的改进。分别构建支持向量机(SVM)、极限学习机(ELM)、K近邻(KNN)和加权K近邻等烟叶分级模型,将分级模型的识别率作为适应度函数,全光谱下ELM和SVM的测试集最优正确率分别为85.75%和91.02%。加权K近邻方法为:一种方法是每个等级中训练集的权重相同,为该等级样本个数的倒数。另一种方法是先找出K个近邻,加上与距离呈负相关的权重,通过计算每个等级的权重之和为烟叶进行定级,两种方法相结合的识别率可达90.77%。加权K近邻的分类效果优于传统K近邻,计算复杂度低于SVM和ELM,本文选用加权K近邻作为烟叶等级判断的分类器。3.基于聚类思想的特征初步筛选。同时考虑相同特征的类内离散度和类间离散度,构造判别特征好与坏的鉴别函数D,依据D值删除拐点右侧特征,在第6个拐点下取得最优分级效果,余下326个特征,测试集正确率由90.77%增加至94.59%,既提高了识别率又降低了特征的个数。4.深层特征的筛选。采用粒子群(BPSO)、遗传算法(GA)、相关系数分析(CC)进一步进行特征的筛选。BPSO取得较好的效果,特征数目由原来的451个减少到143个,这样采集光谱所耗费的时间可节省68.3%;识别率由原来的90.77%提高到93.69%,提高了2.92个百分点。
其他文献
简要介绍合成氨、甲醇、硝酸、磷酸二铵、浓缩水溶肥、复合肥、生物有机肥等项目的建设、投产信息及高浓度氨氮废水资源化处理技术和合成氨系统卧式三重套管高温余热回收废热
信息技术的发展在公共行政管理模式的变革、提高行政决策的合理性和民主性、引发公共行政方法的创新和促进公共行政人员素质的提高四个方面给公共行政带来影响。应提高和强化
考虑由扰动数据重构原函数的导数问题.基于L-广义解正则化理论,提出了一个新的磨光方法的框架.给出一个具体的求解前3阶导数的算法,其中正则化策略选择了一种改进的TSVD(truncated
从保冷材料的性能和经济等选用原则入手,重点介绍了-30℃以下的情况下选用泡沫玻璃和硬质聚氨酯复合保冷结构的优点,并结合实践经验,论述了在施工中常见保冷失效的主要原因。
针对20钢换热管,16Mn锻管板管壳式换热器管板焊接中常见的问题,进行了分析并提出解决措施.
颗粒分析试验是测定干土中各种粒组所占该土总质量的百分数的方法,借以明了颗粒大小分布情况,供土的分类及粗略判断土的工程性质及建筑材料选料之用,其中的密度计法用于测定
学习进阶是近年来国际科学教育界研究的热门课题。自该概念首次提出至今已有十多年时间,且研究侧重点逐渐由理论向实践过渡,美国科学教育界在借鉴学习进阶理论的基础上于2013
应用同伦分析方法,提出了一种求解非线性方程改进的试位法.给出的一些数值例证显示了该运算法则的有效性.
研究了正交异性双材料反平面平板搭接界面端问题.采用复合材料断裂复变方法,构造了特殊应力函数,通过求解一类广义重调和方程组的边值问题,推导出平板搭接界面端的应力场、位移场
国家质量技术监督检验检疫总局质检办特函[2006]144号〈关于锅炉压力容器安全监察工作有关问题的意见〉: