论文部分内容阅读
随着数据库技术的飞速发展及数据库管理系统的广泛应用,数据库不仅在数量上快速增长,规模也越来越大。激增的数据背后隐藏着许多重要的信息,对其进行更高层次的分析,能促进信息的传递。现实中的数据常常与时间有关,按时间顺序取得的一系列观测值被称为时间序列数据,它在社会生活中的各个领域广泛存在。对时间序列数据进行更深一步的分析和处理,对人类社会、科技和经济的发展有重大意义。目前时间序列的数据挖掘是数据挖掘的重要研究热点之一。
本文首先介绍了数据挖掘的相关理论及主要技术、发展状况等。围绕着数据挖掘技术,探讨了时间序列数据挖掘的研究现状,包括研究内容、常用挖掘技术、发展前景及应用状况。
其次,研究了三种主要的时序数据趋势分析技术和算法,即线性回归分析模型、指数平滑模型、灰色预测模型。对它们的推理过程和适用性进行了详细的阐述,同时针对现有方法的缺陷提出了一些改进。通过分析和比较,验证了模型的精度和可靠性。
然后,给出了一种新的组合预测方法。探讨了该组合预测方法的研究价值及具体预测流程,通过实例与前面三种时序数据挖掘方法进行了分析比较,讨论了其可行性和适用性。主要使用了MAPE、MSE、MAE三个评价指标对各算法进行了衡量。
最后,结合实际系统,将上述时序数据挖掘方法应用到电能计量管理系统的预测分析系统中。分析了该系统的设计思想、目标和总体设计框架。在此基础上对历史数据库进行数据挖掘,分析比较各种预测方法,找出精度最佳的一种模型对未来的发展趋势进行预测。通过一个实际时间序列的分析,给出了实验结果,验证了该系统的有效性和可行性。