基于数据挖掘技术的葡萄酒品质预测研究

来源 :陕西科技大学 | 被引量 : 0次 | 上传用户:hongdou0219
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
葡萄酒品质预测是葡萄酒生产过程中进行品质调优控制的重要过程。由于葡萄酒样本数据的品质类别多样性和非平衡性,导致传统的预测模型存在低品质类识别率低的问题。因此,研究一种准确快速的品质预测方法,可以有效提高低品质类的识别率,对于提高葡萄酒生产质量具有重要指导意义。  本文以UCI数据库中的“Wine Quality”数据集为研究对象,以葡萄酒品质与理化指标之间存在复杂的非线性关系为研究基础,采用多分类支持向量机(Support Vector Machine,SVM)算法和集成学习算法建立葡萄酒品质预测模型,以达到提升低品质类葡萄酒识别率的目标。主要工作为以下几个方面:  (1)基于多分类支持向量机的葡萄酒品质预测方法的研究  针对葡萄酒品质数据类别多样性的特点,在传统多分类支持向量机的基础上,提出了一种改进的多分类支持向量机算法。该算法在训练过程中,优先选择样本数量最多的一类与剩余类之间构造“一对多”SVM,然后从剩下的类中选取一个次多类重复上述过程,直到剩余两类之间构造“一对一”SVM。与传统的多分类支持向量机相比,不仅减少了一对一方法产生的决策平面数量,而且解决了一对多方法造成的非平衡问题,可以有效地减少训练时间,提高预测精度。  (2)基于集成多分类支持向量机葡萄酒品质预测方法的研究  为提高改进的多分类支持向量机算法对低品质类的识别率,结合集成学习的思想,探讨了一种AdaBoost集成多分类支持向量机的品质预测方法。在模型训练过程中,利用AdaBoost动态调整样本权值的方式,提高低品质类样本的关注度,能够在保证整体预测性能的同时,显著提高低品质类的识别率。  (3)葡萄酒品质预测仿真模型的构建与评估  结合实际应用,在 PyCharm开发平台下,构建葡萄酒品质预测模型。以Wine Quality数据集为基础,葡萄酒理化属性作为模型输入,感官结果作为模型输出,分别构建多分类支持向量机葡萄酒品质预测模型和集成多分类支持向量机葡萄酒品质预测模型。为评估两种预测模型的预测性能,分别采用四种非平衡数据集预测性能评估指标:Precision、Recall、F-Measure以及ROC曲线,对两种预测模型进行对比分析。实验结果表明,基于集成多分类支持向量机的葡萄酒品质预测模型预测精度高,能够快速并准确地识别样本数据集中的低品质类,并有效解决了具有多类非平衡特点的葡萄酒样本数据预测问题。该预测模型可以为葡萄酒生产过程中的理化指标调优控制提供理论依据和决策支持。
其他文献
随着空间矢量数据总数据量以及计算复杂度的增加,采用集中式模式的传统GIS遇到诸多问题。P2P网络作为一种新的分布式网络技术,能够有效整合网络中所有参与者的资源,利用参与者的
随着网络的发展,数字图像正以惊人的速度增长,因此如何快速、准确的管理,检索出所需要的图像成为迫在眉睫要解决的问题。而传统基于关键字的图像检索因为其本身的局限性,已经不能
在当今的这个信息大爆炸的时代里,人们需要处理的数据量正在呈指数级别的猛增。原有的处理数据方法时刻都需要进一步优化和改进。最优化理论就是这样的实际需要下逐渐发展起
随着电信业用户的增长和多种类型服务的业务推广,使得电信业用户的各种业务行为随之增多,但某些异常情况却造成了电信业收益的负利润问题。本文使用数据挖掘技术对负利润数据
随着新型网络应用的不断出现,流形态数据已经成为数据管理领域研究的新热点。与传统数据相比,数据流具有时变、高到达速率和大数据量等特点。在CPU和存储资源有限的约束条件
无线传感器网络(Wireless Sensor Networks, WSNs)技术虽然起步比较晚,但其发展进程非常迅速,并在当今社会各个领域中发挥重要的作用。一方面是许多目前已经发展比较成熟的前沿科
近年来,伴随着无线多媒体通信技术的迅速发展,无线低功耗监视网络、一次性摄像机、医疗应用、多视角图像监控等新的视频应用不断出现,其特点是应用中的大量资源受限(例如CPU、电
针对电子商务的发展和应用,作者以建立实际网站开展课题研究。论文介绍了开源软件OpenCms的基本概念、组成工具、技术路线和特点,论文研究工作有很好的现实意义。论文给出了需
基于图像的三维重建是虚拟现实、计算机视觉、计算机图形学等领域的重要研究内容,而机器人视觉、人机交互、远程沉浸、动作捕捉等不断增长的应用需求成为了三维建模技术发展的
无线Mesh网络(简称为WMN)是一种新型无线通信网络,它融合了无线Adhoc网络和无线局域网络的特征,具有容量大、速率高、覆盖范围大、传输可靠、扩展性好以及前期投资低等特点,