论文部分内容阅读
摘 要 本文根据2017年高教社杯全国大学生数学建模竞赛C题中提供的物质在不同浓度下的颜色读数采样数据,运用SPSS软件对数据进行多元线性回归分析,得到了各种物质颜色读数与物质浓度的数学模型。对所得模型进行误差分析发现,只有组胺的模型达到精度要求,其它四种物质的模型误差均偏大,且模型失效。对失效的模型,考虑更优的建模方法,计算四种物质数据中五个影响指标两两之间的相关性系数,选取两两之间相关性系数最大的三对指标进行重新组合,得到一组新的数据,之后进行重新建模,最终得到了各物质颜色读数与浓度优化后的非线性数学模型。
关键词 SPSS 回归分析 数学模型
中图分类号:TP311.54 文献标识码:A 文章编号:1007-0745(2021)06-0024-04
1 前言
世界是多姿多彩、五彩缤纷、光鲜亮丽的,我们在日常生活中经常会看见五颜六色的事物,这时便会有朋友好奇颜色为什么会有这么多种,即使是相同的颜色,又为什么会有深浅,大多数人都会说是浓度不同所导致的,的确深浅在我们看来,就是浓淡,亦是物质的浓度,那么如何根据颜色的深浅来确定物质的浓度呢,这使得研究颜色读数与浓度之间的关系就变得越来越重要。
比色法是目前常用的一种检测物质浓度的方法,即把待测物质制备成溶液后滴在特定的白色试纸表面,等其充分反应以后获得一张有颜色的试纸,再把该颜色试纸与一个标准比色卡进行对比,就可以确定待测物质的浓度档位了。由于每个人对颜色的敏感差异和观测误差,使得这一方法在精度上受到很大影响。随着照相技术和颜色分辨率的提高,希望建立颜色读数和物质浓度的数量关系,即只要输入照片中的颜色读数就能够获得待测物质的浓度。
2 模型的建立与求解
首先将附件中的采樣数据导入SPSS,其次在SPSS软件中对各组数据进行多元线性回归分析,得到各物质颜色读数与物质浓度的模型如下:(模型中的符号说明见下表)
3 模型的误差分析
根据以上所得各物质的颜色读数与浓度的模型,将采样数据中各颜色读数代入模型,求得所对应的各物质的浓度模型值yi,之后与所对应的浓度采样值yi进行比较,代入下面平均相对误差的计算公式:
计算得到各物质模型的平均相对误差如下表:
通过表格中的数据可以看出,只有组胺模型的平均相对误差小于10%,在可以接受的范围内,另外四种物质模型的平均相对误差较大,超出了可接受范围,模型失效。[1]
4 模型的改进
对于四种物质的失效模型,考虑更优的建模方法,运用SPSS软件计算四种物质采样数据中五个影响指标(B、G、R、H、S)两两之间的相关性系数,得到的相关性系数结果如上表1~4。
在各种物质中,选取五个影响指标两两之间相关性系数最大的三对指标进行两两组合(对应的指标数据两两之间做乘法运算,得到新的组合数据),两两之间相关性系数最小的指标不进行组合(对应的指标数据取各自的平方,得到新的数据),从而各物质均得到一组新的五个组合指标,并且得到其所对应的数据如表5~8。
将数据导入SPSS软件,并对各物质新组合的数据进行多元线性回归分析,得到了各物质下颜色读数与物质浓度的模型如下:
溴酸钾的模型:
y2=413.977-0.015x1x2-0.09x1x5-0.05x23-0.03x25
工业碱的模型:
y3=-35.338 0.02x1 0.01x2x4-0.01x23-0.03x2x5 0.01x4x5
硫酸化钾的模型:
y4=-12.578-0.00033x1x5-0.001x3x5 0.001x4x5 0.001x22 0.00036x24
奶中尿酸的模型:
y5=7569.571-3.404x1x4 2.019x1x5-5.845x2x3 1.015x21 4.867x22
根据以上所得的非线性数学模型,将采样数据中各颜色读数代入上述模型,求得所对应的各物质的浓度模型值yi,之后与所对应的浓度采样值yi进行比较,代入下面平均相对误差的计算公式:
计算得到以上四种物质模型的平均相对误差如上表9所示。
从表中可以看出,四种物质模型的误差均小于10%,由此可见,改进后的非线性模型与之前由多元线性回归分析所得的模型对比,有了很大的优化。[2]
5 结语
本文运用SPSS软件对采样数据进行了多元线性回归分析,建立了颜色读数和物质浓度的数学模型,并对所建立的模型进行了误差分析和改进,得到了优化后的非线性数学模型,根据颜色读数来预测物质浓度,在实际应用中有一定的参考价值。
参考文献:
[1] 张文彤.SPSS统计分析基础教程[M].北京:高等教育出版社,2017.
[2] 武松,潘发明.SPSS统计分析大全[M].北京:清华大学出版社,2014.
关键词 SPSS 回归分析 数学模型
中图分类号:TP311.54 文献标识码:A 文章编号:1007-0745(2021)06-0024-04
1 前言
世界是多姿多彩、五彩缤纷、光鲜亮丽的,我们在日常生活中经常会看见五颜六色的事物,这时便会有朋友好奇颜色为什么会有这么多种,即使是相同的颜色,又为什么会有深浅,大多数人都会说是浓度不同所导致的,的确深浅在我们看来,就是浓淡,亦是物质的浓度,那么如何根据颜色的深浅来确定物质的浓度呢,这使得研究颜色读数与浓度之间的关系就变得越来越重要。
比色法是目前常用的一种检测物质浓度的方法,即把待测物质制备成溶液后滴在特定的白色试纸表面,等其充分反应以后获得一张有颜色的试纸,再把该颜色试纸与一个标准比色卡进行对比,就可以确定待测物质的浓度档位了。由于每个人对颜色的敏感差异和观测误差,使得这一方法在精度上受到很大影响。随着照相技术和颜色分辨率的提高,希望建立颜色读数和物质浓度的数量关系,即只要输入照片中的颜色读数就能够获得待测物质的浓度。
2 模型的建立与求解
首先将附件中的采樣数据导入SPSS,其次在SPSS软件中对各组数据进行多元线性回归分析,得到各物质颜色读数与物质浓度的模型如下:(模型中的符号说明见下表)
3 模型的误差分析
根据以上所得各物质的颜色读数与浓度的模型,将采样数据中各颜色读数代入模型,求得所对应的各物质的浓度模型值yi,之后与所对应的浓度采样值yi进行比较,代入下面平均相对误差的计算公式:
计算得到各物质模型的平均相对误差如下表:
通过表格中的数据可以看出,只有组胺模型的平均相对误差小于10%,在可以接受的范围内,另外四种物质模型的平均相对误差较大,超出了可接受范围,模型失效。[1]
4 模型的改进
对于四种物质的失效模型,考虑更优的建模方法,运用SPSS软件计算四种物质采样数据中五个影响指标(B、G、R、H、S)两两之间的相关性系数,得到的相关性系数结果如上表1~4。
在各种物质中,选取五个影响指标两两之间相关性系数最大的三对指标进行两两组合(对应的指标数据两两之间做乘法运算,得到新的组合数据),两两之间相关性系数最小的指标不进行组合(对应的指标数据取各自的平方,得到新的数据),从而各物质均得到一组新的五个组合指标,并且得到其所对应的数据如表5~8。
将数据导入SPSS软件,并对各物质新组合的数据进行多元线性回归分析,得到了各物质下颜色读数与物质浓度的模型如下:
溴酸钾的模型:
y2=413.977-0.015x1x2-0.09x1x5-0.05x23-0.03x25
工业碱的模型:
y3=-35.338 0.02x1 0.01x2x4-0.01x23-0.03x2x5 0.01x4x5
硫酸化钾的模型:
y4=-12.578-0.00033x1x5-0.001x3x5 0.001x4x5 0.001x22 0.00036x24
奶中尿酸的模型:
y5=7569.571-3.404x1x4 2.019x1x5-5.845x2x3 1.015x21 4.867x22
根据以上所得的非线性数学模型,将采样数据中各颜色读数代入上述模型,求得所对应的各物质的浓度模型值yi,之后与所对应的浓度采样值yi进行比较,代入下面平均相对误差的计算公式:
计算得到以上四种物质模型的平均相对误差如上表9所示。
从表中可以看出,四种物质模型的误差均小于10%,由此可见,改进后的非线性模型与之前由多元线性回归分析所得的模型对比,有了很大的优化。[2]
5 结语
本文运用SPSS软件对采样数据进行了多元线性回归分析,建立了颜色读数和物质浓度的数学模型,并对所建立的模型进行了误差分析和改进,得到了优化后的非线性数学模型,根据颜色读数来预测物质浓度,在实际应用中有一定的参考价值。
参考文献:
[1] 张文彤.SPSS统计分析基础教程[M].北京:高等教育出版社,2017.
[2] 武松,潘发明.SPSS统计分析大全[M].北京:清华大学出版社,2014.