论文部分内容阅读
摘 要:针对爆破振动速度回归分析中稳健回归分析作用被高估产生疑问,以最小二乘回归和稳健回归和两种方法在爆破振动速度公式参数确定中的应用对比为研究对象,首先介绍了回归分析中特异值的分类和在回归分析前如何用帽子值、权重对观测数据进行分析,并在此分析结果基础上选择最小二乘和稳健回归的依据。
关键词:最小二乘回归;稳健回归;爆破振速;帽子值;权重
1引言:
对于爆破振动分析,各国如美国、日本等提出了基于大量爆破观测数据统计分析出的振速计算公式。其中最为经典在国内实际应用较多的还是前苏联萨道夫斯基提出的计算公式: (1),其中Q为炸药量,kg;R为炸源至测点间距离,m;m为药量指数,m= 或 ,《爆破安全规程》(GB6722—2003) 推荐m取 ;K,α为与爆破点地形,地质条件有关的系数和衰减指数。Q,R都可以根据爆破计划得出准确数据,而K,α取值《爆破安全规程》都只有推荐范围,带有很大的经验性和主观性,此时对公式进行回归分析,根据已经得到爆破振速监测数据,得出符合现场条件K,α值,指导后续爆破设计施工很有必要。
回归分析最常用的是最小二乘回归,其最大缺点就是抗异常值干扰能力太低,也就是异常值的出现就有可能破坏回归分析的准确性,针对这一点 “稳健”回归分析被提了出来,此法在岩石力学 ,煤炭开采 地震振动 等 领域有着广泛应用。但在爆破领域对“稳健”这一概念似乎有些过于拔高 ,稳健回归在有些情况下效果并不如最小二乘有效简便。本文就爆破振动数据分析中如何选用回归分析提出一些意见。
2最小二乘回归分析(OLS回归)与稳健回归分析特点
2.1最小二乘回归分析及其特点
线性回归方程 ,OLS回归就是使残差平方和最小即 ,将OLS回归应用到求解爆破振动公式(1)中参数K,α:
① 将公式(1)线性化,两边取对数: ,令
,则(1)变成:
② (2)
③ (2)式成立的必要条件: 即
整理得: (3)
④ 令D= ,
若D≠0则(3)有唯一解即: , ,再由变量代换关系,求得 ,
线性模型的经典统计推论基于如下几个误差项的假定:
① y与x之间的关系为线性关系。也就是说,在给定x值的情况下,ε的期望值为0, 。②在所有x值下,误差项的方差恒定, 。③误差项 相互独立, ,其中i≠j。
2.2稳健回归
当我们面对特异值束手无策时,也就是说它们不能被重新编码,也无法通过进行形式变换或在模型中纳入新因素的方式得到处理时,稳健回归就是OLS回归之外的合适选择。很多稳健回归的共同目标都是提供不受特异值或偏态残差分布影响的无偏估计。一个文件估计量必须满足两个条件:①数据的微小改动,将不会造成估计的剧烈变化;②在各种条件下估计都有高度的效率。
3 OLS估计及稳健回归分析选择
3.1特异值类型
为了更好理解特异值如何对估计量产生影响,首先将特异值进行分类:①回归特异值:X值处于主体正常数据取值范围内,而Y值与主体数据相差很远的值,回归特异值显著特点就是残差大,但是残差大并不会影响回归直线斜率估计,也就是它并不会影响回归直线趋势,而只是将回归直线平行拉向自己。②“好”杠杆点,一个特异点如果X值离主体平均值越远,则杠杆效应越明显,但却不一定对回归直线的影响越明显,因为如果此时Y值也异常且恰好落在回归直线周围,那么此异常对回归结果还会产生有利影响,这种情况仍采用OLS估计才显明智。③“坏”杠杆点,XY值均异常,且会回归直线斜率改变,使其偏向自己。
3.2回归特异值的探测
①帽子值 : ,指示了对应第i个案例的X值偏离整体X均值的大小,它只能指示杠杆效应,帽子值与其他数据差别较大的值应引起关注,此值有可能是“坏”的杠杆点。
②权重 :稳健回归时每个观察值都会被赋予不同的权重 ,它表示每個值的异常程度,权重越小则表示观察案例越异常。
4稳健回归M-估计简介
4.1M-估计
最小二乘回归时是最小化残差平方和。稳健回归M估计最小化一个递增效率较低的残差函数之和:
(4), 为引入的目标函数,目的是给分布尾部越靠外的观测值的权重越小,常用 估计目标方程:
,其中 ,c通常取1.345。相应赋予每个观察案例的权重为 (5)
为了使(4)中的 具有尺度不变性,引入尺度参数 ,中位绝对离差(MAD)常用,MAD常被用来计算尺度测量S,定义 ,得到S估计 。
(4)式应用到解析萨道夫斯基公式参数: (6)
要使(5)式成立等价于: ,即 (7)
5结论
⑴有“坏”杠杆效应异常值存在情况下,由于最小二乘回归赋予每个观测值相同权重,无法消除异常值的影响,使得回归模型与正常观测值间的误差较大。而稳健回归分析则通过赋予异常值较小权重减小异常值影响,得到回归模型准确性增大。⑵在有异常值存在但为“好”杠杆效应点时,应该最好选择最小二乘回归分析,此法正是通过赋予异常值与正常值相同权重,恰好将通过此异常点反应的实际工况考虑进了回归模型,此异常值并不会对回归直线斜率产生太影响,但降低了估计的标准误差,因为它扩大了估计的x范围。
参考文献
[1] GB6722-2003, 爆破安全规程[S].
[2] 张耀平,曹平,董陇军.岩石抗剪强度计算的稳健回归模型及其应用[J]. 科技导报,2010,28(7):92-95.
[3] 周莉. 岩土抗剪强度参数模糊稳健回归分析[J]. 黑龙江科技学院学报,2007,17(2):90-93.
[4] 郭广礼,李逢春,张连贵. 综放开采地表移动参数的稳健回归分析[J]. 测绘通报,2011,10(3):22-24.
[5] 杨马陵,曲延军,王海涛,温和平. 地震前兆数据的稳健回归与建模[J]. 西北地震学报,1999,21(4):399-406.
[6]武永猛,史秀志,唐礼忠,黄 敏. 爆破振动速度衰减公式的稳健回归分析[J].爆破,2012,29(4):122-126.
[7]WOLFGANG HARDLE. Robust Regression Function Estimation[J]. JOURNAL OF MULTIVARIATE ANALYSIS,1984,14:169-180.
[8]M.C.PINAR. Duality in Robust Linear Regression Using Huber's M-Estimator[J]. Pergamon,1997,10(4):65-70.
作者简介:张鸣(1987-),男,四川攀枝花人,硕士研究生,从事隧道及地下工程爆破方面的研究工作.
关键词:最小二乘回归;稳健回归;爆破振速;帽子值;权重
1引言:
对于爆破振动分析,各国如美国、日本等提出了基于大量爆破观测数据统计分析出的振速计算公式。其中最为经典在国内实际应用较多的还是前苏联萨道夫斯基提出的计算公式: (1),其中Q为炸药量,kg;R为炸源至测点间距离,m;m为药量指数,m= 或 ,《爆破安全规程》(GB6722—2003) 推荐m取 ;K,α为与爆破点地形,地质条件有关的系数和衰减指数。Q,R都可以根据爆破计划得出准确数据,而K,α取值《爆破安全规程》都只有推荐范围,带有很大的经验性和主观性,此时对公式进行回归分析,根据已经得到爆破振速监测数据,得出符合现场条件K,α值,指导后续爆破设计施工很有必要。
回归分析最常用的是最小二乘回归,其最大缺点就是抗异常值干扰能力太低,也就是异常值的出现就有可能破坏回归分析的准确性,针对这一点 “稳健”回归分析被提了出来,此法在岩石力学 ,煤炭开采 地震振动 等 领域有着广泛应用。但在爆破领域对“稳健”这一概念似乎有些过于拔高 ,稳健回归在有些情况下效果并不如最小二乘有效简便。本文就爆破振动数据分析中如何选用回归分析提出一些意见。
2最小二乘回归分析(OLS回归)与稳健回归分析特点
2.1最小二乘回归分析及其特点
线性回归方程 ,OLS回归就是使残差平方和最小即 ,将OLS回归应用到求解爆破振动公式(1)中参数K,α:
① 将公式(1)线性化,两边取对数: ,令
,则(1)变成:
② (2)
③ (2)式成立的必要条件: 即
整理得: (3)
④ 令D= ,
若D≠0则(3)有唯一解即: , ,再由变量代换关系,求得 ,
线性模型的经典统计推论基于如下几个误差项的假定:
① y与x之间的关系为线性关系。也就是说,在给定x值的情况下,ε的期望值为0, 。②在所有x值下,误差项的方差恒定, 。③误差项 相互独立, ,其中i≠j。
2.2稳健回归
当我们面对特异值束手无策时,也就是说它们不能被重新编码,也无法通过进行形式变换或在模型中纳入新因素的方式得到处理时,稳健回归就是OLS回归之外的合适选择。很多稳健回归的共同目标都是提供不受特异值或偏态残差分布影响的无偏估计。一个文件估计量必须满足两个条件:①数据的微小改动,将不会造成估计的剧烈变化;②在各种条件下估计都有高度的效率。
3 OLS估计及稳健回归分析选择
3.1特异值类型
为了更好理解特异值如何对估计量产生影响,首先将特异值进行分类:①回归特异值:X值处于主体正常数据取值范围内,而Y值与主体数据相差很远的值,回归特异值显著特点就是残差大,但是残差大并不会影响回归直线斜率估计,也就是它并不会影响回归直线趋势,而只是将回归直线平行拉向自己。②“好”杠杆点,一个特异点如果X值离主体平均值越远,则杠杆效应越明显,但却不一定对回归直线的影响越明显,因为如果此时Y值也异常且恰好落在回归直线周围,那么此异常对回归结果还会产生有利影响,这种情况仍采用OLS估计才显明智。③“坏”杠杆点,XY值均异常,且会回归直线斜率改变,使其偏向自己。
3.2回归特异值的探测
①帽子值 : ,指示了对应第i个案例的X值偏离整体X均值的大小,它只能指示杠杆效应,帽子值与其他数据差别较大的值应引起关注,此值有可能是“坏”的杠杆点。
②权重 :稳健回归时每个观察值都会被赋予不同的权重 ,它表示每個值的异常程度,权重越小则表示观察案例越异常。
4稳健回归M-估计简介
4.1M-估计
最小二乘回归时是最小化残差平方和。稳健回归M估计最小化一个递增效率较低的残差函数之和:
(4), 为引入的目标函数,目的是给分布尾部越靠外的观测值的权重越小,常用 估计目标方程:
,其中 ,c通常取1.345。相应赋予每个观察案例的权重为 (5)
为了使(4)中的 具有尺度不变性,引入尺度参数 ,中位绝对离差(MAD)常用,MAD常被用来计算尺度测量S,定义 ,得到S估计 。
(4)式应用到解析萨道夫斯基公式参数: (6)
要使(5)式成立等价于: ,即 (7)
5结论
⑴有“坏”杠杆效应异常值存在情况下,由于最小二乘回归赋予每个观测值相同权重,无法消除异常值的影响,使得回归模型与正常观测值间的误差较大。而稳健回归分析则通过赋予异常值较小权重减小异常值影响,得到回归模型准确性增大。⑵在有异常值存在但为“好”杠杆效应点时,应该最好选择最小二乘回归分析,此法正是通过赋予异常值与正常值相同权重,恰好将通过此异常点反应的实际工况考虑进了回归模型,此异常值并不会对回归直线斜率产生太影响,但降低了估计的标准误差,因为它扩大了估计的x范围。
参考文献
[1] GB6722-2003, 爆破安全规程[S].
[2] 张耀平,曹平,董陇军.岩石抗剪强度计算的稳健回归模型及其应用[J]. 科技导报,2010,28(7):92-95.
[3] 周莉. 岩土抗剪强度参数模糊稳健回归分析[J]. 黑龙江科技学院学报,2007,17(2):90-93.
[4] 郭广礼,李逢春,张连贵. 综放开采地表移动参数的稳健回归分析[J]. 测绘通报,2011,10(3):22-24.
[5] 杨马陵,曲延军,王海涛,温和平. 地震前兆数据的稳健回归与建模[J]. 西北地震学报,1999,21(4):399-406.
[6]武永猛,史秀志,唐礼忠,黄 敏. 爆破振动速度衰减公式的稳健回归分析[J].爆破,2012,29(4):122-126.
[7]WOLFGANG HARDLE. Robust Regression Function Estimation[J]. JOURNAL OF MULTIVARIATE ANALYSIS,1984,14:169-180.
[8]M.C.PINAR. Duality in Robust Linear Regression Using Huber's M-Estimator[J]. Pergamon,1997,10(4):65-70.
作者简介:张鸣(1987-),男,四川攀枝花人,硕士研究生,从事隧道及地下工程爆破方面的研究工作.