论文部分内容阅读
摘 要:本文通过分析经济预测中数据缺失的种类,根据实际预测中遇到的情况,总结了经济预测中缺失数据的处理方法,并提出一种较有效的数据填补方法Knowledge Miner预测填补数据法,并通过实例验证了该方法的有效性。
关键词:经济预测 数据缺失 填补方法
一、序言
定量经济预测,需要对经济活动中的数量关系进行计算、比较和分析,才能使错综复杂的经济现象,以其简明精确的数学模型表达出来,从而揭示有关对象之间的内在联系和最优数据关系,消除人们在管理和决策上的某些直觉性和随意性,使现代管理建立在对客观对象进行科学分析和精确计算的基础之上,有效地发挥现代管理方法在管理现代经济中的作用,达到提高经济效益的目的。然而在实际的预测中,由于受到现实的局限性,历史数据会因为这样或那样的原因导致缺失,为了提高预测的满意性,采取有效措施将缺失数据补齐是必不可少的。
二、经济预测中数据缺失
经济预测是在有关的宏、微观经济学理论指导下,以经济发展的历史和现状为出发点,以调查研究和统计资料为依据,以科学的定性分析判断和严谨定理计算为手段,对预测对象有关经济活动的发展演变规律通过预测模型进行分析和解释,从而对预测对象的未来发展演变程度预先做出科学的推测。
国内外很多学者都对缺失数据的处理提出了自己独到的见解,来挽救有缺失的调查数据,以保证研究工作顺利进行[1],鉴于经济预测自身的特点,其缺失数据的补齐具有相应的特性,主要有以下几种方法。
(1)推断法
统计数据中极有可能某些数据是在长期的存放过程中,字迹模糊丢失,比如社会消费品零售总额这个这个指标2003年12月同比增长率有数据,而绝对值丢失,这是可以利用2003年11月份的数据乘以同比增长率然后得到2003年12月份的数据,同理比如工业增加值这个指标如果缺失数据,可以找到对应的第一、第二、第三产业增加值,将三个已知数据值加总,便可以得到。这种填补方法更加贴合经济理论,保证了填补的正确性。但是也有局限性,如果2003年11月份的数据也缺失,或者2003年12月的同比增长率同样丢失,则该方法实效。
(2)删除法
最簡单的缺失数据处理方法,即在预测过程中,不考虑缺失的数据,直接使用现有的数据进行预测。
(3)取平均数法
根据上下两个月的数据取其平均数,填充于缺失数据处,然后进行预测。这种方法通常是缺少某一个月度、季度或者年度的数据时,比如成都市社会消费品零售总额这个指标,缺少2005年1月份的数据,则可以使用2005年2月份和2004年12月份的数据的平均数将其作为2005年1月份数据的替补。
(4)取等差数列法
这种方法与平均数法有些对应,其适用的范围恰恰是缺少连续的两个或两个以上的数据。比如外贸进出口总额(海关数)指标2005年6、7、8月份的数据均缺失,则可以根据5月份的数据14.8(单位:亿美元)和9月份的数据31.9(单位:亿美元)采用等差数列的的方法,将6、7、8月分的数据分别补充为19.075,23.35,27.625(单位:亿美元)(注:因为考虑到外贸进出口额的数据是逐渐递增的,所以等差数列排序是由六月份递增到八月份)。
三、Knowledge Miner预测填补数据法
经济预测数据的填补目的是为了提高经济预测的满意度,所以本文采取的检验标准是采用填补后的完整数据进行预测所达到的满意程度。而经济预测指标之间往往存在某种内在联系,Knowledge Miner是一种自组织建模和预测的工具,用其进行确实数据的填补效果较好,且在进行预测时不需要采用其他软件,方便实用。为了排除这种联系带来的干扰,采用自回归预测模型所使用的专用预测工具Knowledge Miner来进行检验比较。本文使用社会消费品零售总额指标的数据作为例子进行比较几种不同的填补方法后进行预测数据的精确率,见表
表、数据缺失填补方法精确率比较
由表可见,使用Knowledge Miner预测填补数据法进行预测的误差率明显小于其他几种方法,从实际上证明了该方法的有效性。
四、结束语
经济预测具有其自身的特点,其缺失数据的具有相应的特性,所以在进行缺失数据的补齐时,需要考虑其特定的含义,进行缺失数据补齐时,也不仅仅局限于某些数据填补方法,本文提出的Knowledge Miner预测填补数据法就是根据在实际经济预测中的遇到的实际情况而提出的填补方法,经验证,该方法有效,且优于其他许多方法,此外,值得指出的是,由于数据缺失的原因不同,数据缺失的特征也不尽相同,所以采用多种数据填补方法相结合的措施也是很有意义的。且预测效果会更佳。
参考文献:
[1]Rubin D.Inference and missing data[J].Biometrika,1976,63(3):581-592.
[2]Bello AL.Imputation techniques in regression analysis:Looking closely at their
implementation[J].Computational Statistics and Data Analysis,1995,20:45-57.
[3]岳勇,田考聪.数据缺失及其填补方法综述.预防医学情报2005;21(6):683-685.
关键词:经济预测 数据缺失 填补方法
一、序言
定量经济预测,需要对经济活动中的数量关系进行计算、比较和分析,才能使错综复杂的经济现象,以其简明精确的数学模型表达出来,从而揭示有关对象之间的内在联系和最优数据关系,消除人们在管理和决策上的某些直觉性和随意性,使现代管理建立在对客观对象进行科学分析和精确计算的基础之上,有效地发挥现代管理方法在管理现代经济中的作用,达到提高经济效益的目的。然而在实际的预测中,由于受到现实的局限性,历史数据会因为这样或那样的原因导致缺失,为了提高预测的满意性,采取有效措施将缺失数据补齐是必不可少的。
二、经济预测中数据缺失
经济预测是在有关的宏、微观经济学理论指导下,以经济发展的历史和现状为出发点,以调查研究和统计资料为依据,以科学的定性分析判断和严谨定理计算为手段,对预测对象有关经济活动的发展演变规律通过预测模型进行分析和解释,从而对预测对象的未来发展演变程度预先做出科学的推测。
国内外很多学者都对缺失数据的处理提出了自己独到的见解,来挽救有缺失的调查数据,以保证研究工作顺利进行[1],鉴于经济预测自身的特点,其缺失数据的补齐具有相应的特性,主要有以下几种方法。
(1)推断法
统计数据中极有可能某些数据是在长期的存放过程中,字迹模糊丢失,比如社会消费品零售总额这个这个指标2003年12月同比增长率有数据,而绝对值丢失,这是可以利用2003年11月份的数据乘以同比增长率然后得到2003年12月份的数据,同理比如工业增加值这个指标如果缺失数据,可以找到对应的第一、第二、第三产业增加值,将三个已知数据值加总,便可以得到。这种填补方法更加贴合经济理论,保证了填补的正确性。但是也有局限性,如果2003年11月份的数据也缺失,或者2003年12月的同比增长率同样丢失,则该方法实效。
(2)删除法
最簡单的缺失数据处理方法,即在预测过程中,不考虑缺失的数据,直接使用现有的数据进行预测。
(3)取平均数法
根据上下两个月的数据取其平均数,填充于缺失数据处,然后进行预测。这种方法通常是缺少某一个月度、季度或者年度的数据时,比如成都市社会消费品零售总额这个指标,缺少2005年1月份的数据,则可以使用2005年2月份和2004年12月份的数据的平均数将其作为2005年1月份数据的替补。
(4)取等差数列法
这种方法与平均数法有些对应,其适用的范围恰恰是缺少连续的两个或两个以上的数据。比如外贸进出口总额(海关数)指标2005年6、7、8月份的数据均缺失,则可以根据5月份的数据14.8(单位:亿美元)和9月份的数据31.9(单位:亿美元)采用等差数列的的方法,将6、7、8月分的数据分别补充为19.075,23.35,27.625(单位:亿美元)(注:因为考虑到外贸进出口额的数据是逐渐递增的,所以等差数列排序是由六月份递增到八月份)。
三、Knowledge Miner预测填补数据法
经济预测数据的填补目的是为了提高经济预测的满意度,所以本文采取的检验标准是采用填补后的完整数据进行预测所达到的满意程度。而经济预测指标之间往往存在某种内在联系,Knowledge Miner是一种自组织建模和预测的工具,用其进行确实数据的填补效果较好,且在进行预测时不需要采用其他软件,方便实用。为了排除这种联系带来的干扰,采用自回归预测模型所使用的专用预测工具Knowledge Miner来进行检验比较。本文使用社会消费品零售总额指标的数据作为例子进行比较几种不同的填补方法后进行预测数据的精确率,见表
表、数据缺失填补方法精确率比较
由表可见,使用Knowledge Miner预测填补数据法进行预测的误差率明显小于其他几种方法,从实际上证明了该方法的有效性。
四、结束语
经济预测具有其自身的特点,其缺失数据的具有相应的特性,所以在进行缺失数据的补齐时,需要考虑其特定的含义,进行缺失数据补齐时,也不仅仅局限于某些数据填补方法,本文提出的Knowledge Miner预测填补数据法就是根据在实际经济预测中的遇到的实际情况而提出的填补方法,经验证,该方法有效,且优于其他许多方法,此外,值得指出的是,由于数据缺失的原因不同,数据缺失的特征也不尽相同,所以采用多种数据填补方法相结合的措施也是很有意义的。且预测效果会更佳。
参考文献:
[1]Rubin D.Inference and missing data[J].Biometrika,1976,63(3):581-592.
[2]Bello AL.Imputation techniques in regression analysis:Looking closely at their
implementation[J].Computational Statistics and Data Analysis,1995,20:45-57.
[3]岳勇,田考聪.数据缺失及其填补方法综述.预防医学情报2005;21(6):683-685.