论文部分内容阅读
摘 要:随着生活水平的提高,人们对休闲娱乐的要求越来越高,大型游乐场成为了人们休闲娱乐的一个重要场所。为使游客达到最大满意度、提高运营经济效益,对典型的大型游乐场游乐设施和游乐线路的布局、规划、管理及相互协调进行了分析和择优。
关键词:MATLAB仿真分析;大型游乐场的经营和优化;AR自回归模型
一、AR谱估计的方法进行数学建模
谱估计的参数建模包括选择一个合适的模型、估计模型的参数以及将这些估计值代入理论PSD公式三部分。这里分析的模型是时间序列模型。
自回归模型(Autoregressive Model)是用自身做回归变量的过程,即利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型,它是时间序列中的一种常见形式。在该模型中,噪声干扰驱动信号可以忽略不计,直接按照时间序列历程信号进行AR自回归模型建模,计算各阶次拟合系数进行评估分析,进而预测。
时间序列模型:所谓的时间序列就是将所要研究的对象按照观测时间的先后顺序所形成的一种有序数列。时间序列分析是数学概率统计学科中应用较广泛的一个分支,在金融经济、地理气象、通讯分析、医学诊断、机械振动等众多领域有着非常广泛的应用。时间序列预测模型主要的特点就是认为观测值之间的依赖关系和相关性是存在的,观测数据之间内部和外部形成一定的规律和特征,它是一种能够应用于动态预测中的动态预测模型。
时间序列预测模型就是通过对观测数据的分类和分析,根据时间序列所反映出来的数据内部和外部之间的规律和相关性,进而通过数据关系描述出研究现象的发展过程和未来变化趋势,然后再进行类推或延伸,以此来预测以后若干时间段内可能的数据变化。其内容包括:采集与分类所研究社会现象的历史、数据;然后对这些历史数据进行分析并做检查鉴别,按规律排序成特定数列然后对数列进行分析,从中寻找出数列的规律和数据相关性,进而得出合适的预测模型参数和阶数,并用此模型去预测未来趋势。
二、数据预处理
2.1离群值的检测和去离群值
数据中的离群值可能使数据处理结果和其他计算量严重失真。例如,如果我们尝试用移动平均值方法对包含离群值的数据进行平滑处理,则可能得到误导性的波峰或波谷。
那么如何检测某个特征数据是否存在极端值呢?
1)对样本数据进行可视化
2.2归一化
归一化概念:
1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速
2)把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量
一般,我们常用的归一化方法有两种:min-max归一化和z-score归一化。
min-max归一化:将数值范围缩放到(0,1),但没有改变数据分布;z-score归一化:将数值范围缩放到0附近, 但没有改变数据分布;
在本题中,我们通过对数据规模的分析和处理,最终我们在MATLAB中使用normalize函数来对数据进行归一化。
三、模型求解
对于AR谱估计通常有三种方案:Yule-Walker法,Wiener滤波法,最大熵(MEM)方法。
(1)Yule-Walker法:(尤尔-沃克方程为AR模型的系数和AR过程的归一化相关系数建立起了唯一的对应关系。)
对于满足渐近平稳的AR过程:
在式子两边同乘以且求期望:
故有,其中
最大熵法是对信号的功率谱密度估计的一种方法。其原理是取一组时间序列,使其自相关函数与一组已知数据的自相关函数相同,同时使已知自相关函数以外的部分的随机性最强,以所取时间序列的谱作为已知数据的谱估值。它等效于根据使随机过程的熵为最大的原则,利用N个已知的自相关函数值来外推其他未知的自相关函数值所得到的功率谱。最大熵法功率谱估值是一种可获得高分辨率的非线性估计方法, 特别适用于数据长度较短的情况。
四、结果分析(或模型检验)
问题(1):请预测该游乐场2019年7月和8月每一天的游客的人数,预测2019年下半年游客人数最多出现在那一天。
利用AR模型进行同比预测,利用2019年度的前半年和2018年度的前半年运营数据,经过去离群值、增量归一化等预处理后,计算出增长百分比,预测2019年后半年人数,2019年下半年游客人数最多出现在10月1日,对应的峰值点对应的日,联系实际情况分析,由于是节假日,预测的人数最多也是合理情况。
问题(2):预测2019年8月5日A4,B5,B12,B25四个项目当天的游玩人数,以及8月5日每一个项目的平均排队人数和平均等待时间。
预测的AR模型同(1),给出了A4,B5,B12,B25四个项目的游客人数趋势,通过AR模型预测2019年8月5日A4,B5,B12,B25四个项目当天的游玩人数14516、14468、689、12634,同比增长0.52、0.62、1.12、0.46。平均排队人数和平均等待时间,取能容纳的人数最大值,除以总时间,就是平均等待时间。通过模型预测分析可知,而且2019年8月5号会场场爆满,8月5日当天每一个项目的平均排队人数和平均等待时间均比较长,与同期人流进行比对,8月5日是旺季,加上人流增长,不调整游玩策略一定会场场爆满,不利于游人的玩耍。
问题(3):某游客计划在2019年8月5日到该游乐场购买通票游玩,您认为按照怎样顺序游玩最合适?
用平均等待时间排序,从小到大,从需要排队时间少的开始玩,能保证一直在玩项目而不是在排隊,排队顺序为如下图8所示,
问题(4):对经营者来说您认为通票价格定在225元是否合理?10元的门票费用是否可以取消?
利用AR模型评估每个项目游玩所需要的平均时间,如下图9所示。用等待时间+玩耍每个项目的时间,求出每个项目共需要多少时间,然后求平均,得到平均每个项目耗费24分钟,按照一天营业12小时算,大约能玩24或25个项目,作为消费者,一般只玩15个项目,每个项目的平均价格是20块,共需要300块,加上门票,一共310块,大于225。因此消费者买通票更划算,可以取消门票。
五、模型的不足
本题在设计模型求解过程中,使用的是自回归(AR)模型。AR模型适用于具有尖峰但没有深谷的谱分析,对时间历程曲线有一定的要求,本文着重研究AR模型的建模及求解,并做了多个假设,且忽略了不同时间历程中存在的扰动,难免会有模型缺陷,值得后续继续改善模型进行研究。
六、模型改进(或进一步讨论)
AR模型适用于具有尖峰但没有深谷的谱分,于此对应的经典的时间历程预测建模与评估分析模型还用MA模型、ARMA模型,MA模型适用于具有深谷但没有尖峰的谱,通用的ARMA模型对于两种极端情况均适用。
参考文献
[1]李志飞.主题公园开发[M].科学出版社,2000,08:90-100.
[2]熊瑛.大型主题公园策划与规划研究[D].北京工业大学,2001,07:32-50.
关键词:MATLAB仿真分析;大型游乐场的经营和优化;AR自回归模型
一、AR谱估计的方法进行数学建模
谱估计的参数建模包括选择一个合适的模型、估计模型的参数以及将这些估计值代入理论PSD公式三部分。这里分析的模型是时间序列模型。
自回归模型(Autoregressive Model)是用自身做回归变量的过程,即利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型,它是时间序列中的一种常见形式。在该模型中,噪声干扰驱动信号可以忽略不计,直接按照时间序列历程信号进行AR自回归模型建模,计算各阶次拟合系数进行评估分析,进而预测。
时间序列模型:所谓的时间序列就是将所要研究的对象按照观测时间的先后顺序所形成的一种有序数列。时间序列分析是数学概率统计学科中应用较广泛的一个分支,在金融经济、地理气象、通讯分析、医学诊断、机械振动等众多领域有着非常广泛的应用。时间序列预测模型主要的特点就是认为观测值之间的依赖关系和相关性是存在的,观测数据之间内部和外部形成一定的规律和特征,它是一种能够应用于动态预测中的动态预测模型。
时间序列预测模型就是通过对观测数据的分类和分析,根据时间序列所反映出来的数据内部和外部之间的规律和相关性,进而通过数据关系描述出研究现象的发展过程和未来变化趋势,然后再进行类推或延伸,以此来预测以后若干时间段内可能的数据变化。其内容包括:采集与分类所研究社会现象的历史、数据;然后对这些历史数据进行分析并做检查鉴别,按规律排序成特定数列然后对数列进行分析,从中寻找出数列的规律和数据相关性,进而得出合适的预测模型参数和阶数,并用此模型去预测未来趋势。
二、数据预处理
2.1离群值的检测和去离群值
数据中的离群值可能使数据处理结果和其他计算量严重失真。例如,如果我们尝试用移动平均值方法对包含离群值的数据进行平滑处理,则可能得到误导性的波峰或波谷。
那么如何检测某个特征数据是否存在极端值呢?
1)对样本数据进行可视化
2.2归一化
归一化概念:
1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速
2)把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量
一般,我们常用的归一化方法有两种:min-max归一化和z-score归一化。
min-max归一化:将数值范围缩放到(0,1),但没有改变数据分布;z-score归一化:将数值范围缩放到0附近, 但没有改变数据分布;
在本题中,我们通过对数据规模的分析和处理,最终我们在MATLAB中使用normalize函数来对数据进行归一化。
三、模型求解
对于AR谱估计通常有三种方案:Yule-Walker法,Wiener滤波法,最大熵(MEM)方法。
(1)Yule-Walker法:(尤尔-沃克方程为AR模型的系数和AR过程的归一化相关系数建立起了唯一的对应关系。)
对于满足渐近平稳的AR过程:
在式子两边同乘以且求期望:
故有,其中
最大熵法是对信号的功率谱密度估计的一种方法。其原理是取一组时间序列,使其自相关函数与一组已知数据的自相关函数相同,同时使已知自相关函数以外的部分的随机性最强,以所取时间序列的谱作为已知数据的谱估值。它等效于根据使随机过程的熵为最大的原则,利用N个已知的自相关函数值来外推其他未知的自相关函数值所得到的功率谱。最大熵法功率谱估值是一种可获得高分辨率的非线性估计方法, 特别适用于数据长度较短的情况。
四、结果分析(或模型检验)
问题(1):请预测该游乐场2019年7月和8月每一天的游客的人数,预测2019年下半年游客人数最多出现在那一天。
利用AR模型进行同比预测,利用2019年度的前半年和2018年度的前半年运营数据,经过去离群值、增量归一化等预处理后,计算出增长百分比,预测2019年后半年人数,2019年下半年游客人数最多出现在10月1日,对应的峰值点对应的日,联系实际情况分析,由于是节假日,预测的人数最多也是合理情况。
问题(2):预测2019年8月5日A4,B5,B12,B25四个项目当天的游玩人数,以及8月5日每一个项目的平均排队人数和平均等待时间。
预测的AR模型同(1),给出了A4,B5,B12,B25四个项目的游客人数趋势,通过AR模型预测2019年8月5日A4,B5,B12,B25四个项目当天的游玩人数14516、14468、689、12634,同比增长0.52、0.62、1.12、0.46。平均排队人数和平均等待时间,取能容纳的人数最大值,除以总时间,就是平均等待时间。通过模型预测分析可知,而且2019年8月5号会场场爆满,8月5日当天每一个项目的平均排队人数和平均等待时间均比较长,与同期人流进行比对,8月5日是旺季,加上人流增长,不调整游玩策略一定会场场爆满,不利于游人的玩耍。
问题(3):某游客计划在2019年8月5日到该游乐场购买通票游玩,您认为按照怎样顺序游玩最合适?
用平均等待时间排序,从小到大,从需要排队时间少的开始玩,能保证一直在玩项目而不是在排隊,排队顺序为如下图8所示,
问题(4):对经营者来说您认为通票价格定在225元是否合理?10元的门票费用是否可以取消?
利用AR模型评估每个项目游玩所需要的平均时间,如下图9所示。用等待时间+玩耍每个项目的时间,求出每个项目共需要多少时间,然后求平均,得到平均每个项目耗费24分钟,按照一天营业12小时算,大约能玩24或25个项目,作为消费者,一般只玩15个项目,每个项目的平均价格是20块,共需要300块,加上门票,一共310块,大于225。因此消费者买通票更划算,可以取消门票。
五、模型的不足
本题在设计模型求解过程中,使用的是自回归(AR)模型。AR模型适用于具有尖峰但没有深谷的谱分析,对时间历程曲线有一定的要求,本文着重研究AR模型的建模及求解,并做了多个假设,且忽略了不同时间历程中存在的扰动,难免会有模型缺陷,值得后续继续改善模型进行研究。
六、模型改进(或进一步讨论)
AR模型适用于具有尖峰但没有深谷的谱分,于此对应的经典的时间历程预测建模与评估分析模型还用MA模型、ARMA模型,MA模型适用于具有深谷但没有尖峰的谱,通用的ARMA模型对于两种极端情况均适用。
参考文献
[1]李志飞.主题公园开发[M].科学出版社,2000,08:90-100.
[2]熊瑛.大型主题公园策划与规划研究[D].北京工业大学,2001,07:32-50.