论文部分内容阅读
中国的粮食生产问题,不仅是中国经济界的重要研究课题,而且也越来越受到世界经济学家的重视。我国是人口大国,吃饭问题被放在首位,而且还因为我国的粮食生产经常出现波动,粮食生产的不稳定对国民经济的影响不容忽视,所以建立粮食产量的预测模型至关重要。
首先,本文讨论了利用偏最小二乘回归建立数学模型的步骤和方法,为粮食产量预测模型的建立提供了理论依据。
然后,本文针对采用偏最小二乘回归所建立的数学模型中包含原始所有变量,而影响粮食产量的因素是庞杂的这一问题,提出了采用降维的思想用几个综合因子来最大程度的代表原始变量,从而建立模型。
本文提出了一个基于聚类的偏最小二乘回归方法,它主要用于处理高维变量以及变量之间存在高度相关性这一类问题。通过降维思想使得所建立模型中包含变量的个数减少了,有利于模型的分析,并且通过实例证明,模型的预测精度有所提高。
偏最小二乘回归是一种综合了主成分分析和因子分析的线性回归方法,因此本文对所建立的模型进行一系列的辅助分析。它包括与典型相关分析对应的研究内容:精度分析,自变量在解释因变量集合时的作用;与主成分分析对应的研究内容:对样本点分布结构的观察,通过制作T2椭圆图,检测样本点中是否存在异常点。通过这一系列辅助分析发现原始样本点中存在异常点。
最后,文章提出了通过构造统计量的方法,对所给的样本点进行检测,从而将异常点删除,利用所剩样本点采用聚类偏最小二乘回归来建立模型。实例证明:异常点删除后所建立的模型可以更好的预测粮食产量。