分类建模方法在光谱水质分析中的应用研究

被引量 : 0次 | 上传用户:hongchaozhang88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模型定量回归技术依赖于测量数据的特性,若测量的数据满足所用算法的假设或者分布等条件,则预测模型应用效果好,否则不理想。在水质有机物综合指标光谱法定量回归分析中,由于自然水样的复杂多变性,导致全样本单模型建模回归的精度无法保证。而根据相似的水样预测精度较高的规律,采用分类方法之一的聚类技术根据水样之间相似度分类,再进行多模型建模的方法,是解决上述问题并提高水质模型回归精度和泛化性的重要的方法之一。水质光谱定量分析技术相比较于传统基于湿化学原理的检测方法,是一种具有快速有效、灵敏度高、无二次污染、操作简单等优点的绿色检测技术。本文对水质有机物综合指标进行分类模型建模研究,建立了基于聚类算法的分类预测模型。其中,运用聚类、聚类集成,回归预测方法,对样本数据根据分类信息建立多组模型,其实验结果表明此方法相比于全数据单模型方法更能有效地利用样本信息,提供更高精度的回归模型,为水质分析提供更加可靠的检测方法。本文具体研究主要内容包括:1)首先,本文介绍了水质有机物综合指标光谱法快速检测技术的基本原理,并针对现实检测的100个水样,利用全样本单模型建立了水质总有机碳(TOC)指标的最小二乘支持向量机(LSSVM)预测模型,并通过均方误差,均方误差百分比,相关系数等指标评估模型性能。2)接着,本文创新性提出并建立了基于聚类算法的分类模型——AP-LSSVM模型,并仿真研究了该模型在光谱法水质分析中的应用效果。用该方法与全样本单模型的模型预测效果进行比较,结果表明该模型在预测精度方面有显著提高。但模型中AP聚类算法产生的聚类输出的类别较多,致使某些训练样本数目少,降低了这些模型的精度。为了进一步提高分类模型的精度和模型的泛化性,更有效地综合利用分类信息,在AP-LSSVM模型基础上,本文进一步提出了一种基于聚类集成(Cluster Ensemble,部分文献也译为聚类融合)的分类模型回归算法。算法首先对建模样本进行聚类,然后应用聚类集成得到各个子模型的训练样本并通过最小二乘支持向量机建立各个回归子模型,最后对子模型进行选择、组合得到最终的预测结果。聚类类集成过程中过量聚类成员匹配步骤利用蚁群算法进行匹配:将聚类算法产生的过量聚类成员看做是一个地点,两端加上起点和终点,模仿蚁群算法解决TSP问题中的寻找最优路径的方式,利用蚁群算法找到若干个代表着相似度最大的最优路径,即表示可以将这个路径上的点代表的子类合并成一个大类。仿真结果表明:采用蚁群算法聚类集成后建立的分类模型可以有效地利用训练样本信息,从而提高了模型的预测精度和泛化性能。3)最后,对课题进行总结与展望。
其他文献
生态系统服务功能价值是生态系统服务功能进行货币化评价结果。将生态系统服务功能进行货币化,使得生态系统服务功能价值水平得以明确,也有益于人类对于生态系统服务功能价值
盖斯凯尔夫人是维多利亚时期著名的女性作家之一。她所写的小说内容的覆盖面较广:从喧嚣的城市到偏远的乡村,从激烈的阶级冲突到平和的家庭和和从上层社会生活的奢侈到下层社会
<正>新课程改革以来,高中英语课堂发生了深刻的变化:对高效教学的追求更加主动,对发展理念的贯彻更加自觉。但是,我们还必须看到由于受传统教学观念的影响,特别是对新课程理
在全球能源紧缺的背景下,燃料电池作为新一代的能源产生方式,具有高效率、无污染等优点,是众多学者的研究重点。质子交换膜燃料电池(PEMFC)噪声低、零污染、耐腐蚀、工作寿命
学位
本文根据某产品自动化测试系统的需求,提出了基于LabWindows/CVI的软件设计方案,并对其关键技术进行了研究。论文首先描述了该自动测试系统研制的背景和国内外自动测试系统软
本文从城市社区治理制度的历史渊源和概念出发,对城市社区治理的主体、内容、特征及类型进行了厘定,综合考察了现代城市社区治理制度的国内外现状,分析了我国城市社区治理制
节能环保是目前世界各国科学家都追求的目标,石蜡是应用十分广范的相变材料,具有许多优点,但同时存在着固液相变体积变化大、泄露以及传热差等缺点。将石蜡微胶囊化能很好的解决
随着全球经济一体化进程加快,世界经济可谓风起云涌变幻莫测。我国继改革开放之后,走出了一个不平凡的三十年,九十年代之后开始走市场化道路,国内生产总值更是以每年两位数的
当前,“入园难、入园贵”是我国学前教育面临的突出问题,已经引起中央及各级政府的重视。为解决适龄幼儿“入园难、入园贵”的问题,建设普惠性幼儿园的设想被提上日程,有些地区甚
1995年国际原子量的修订1995年8月,IUPAC原子量与同位素丰度委员会在英国Guildford会议上决定修订五项原子量如下:注:括号内的数是末位数的不确定度,*需复合其中铕和铈两项原子量的新标准,是我国的贡献。铕