论文部分内容阅读
摘要[目的]评估上海气象梯度塔2010~2013年观测数据质量及设备运行效能。[方法]基于上海地区现有的9座气象梯度观测塔2010~2013年的分钟级观测数据,针对气温、相对湿度、水平风向和水平风速等观测要素,根据梯度塔立体垂直的观测特点,建立了梯度观测数据质量控制模型并对梯度数据进行了综合质量控制;从数据获取率、数据疑误率、数据有效性等方面对梯度数据进行了统计与评估。[结果]2010年度的数据接收、存储最为完整,2011年度最差;气温、风速的观测数据异常情况较少,湿度和风向数据的异常较多;极值控制检查出了较多的气温异常情况;分钟连续性和小时连续性可以检查出气温和相对湿度的异常跳变;僵值检查可在每一个要素的质量控制中发挥出重要的作用。[结论]该研究可为上海地区近地层大气的风温结构特征研究提供更加准确、客观的梯度观测数据。
关键词气象梯度塔;观测数据;质量控制;运行评估
中图分类号S16文献标识码
A文章编号0517-6611(2016)08-228-06
Abstract[Objective] The aim was to evaluate observational data quality and equipment operation performance in Shanghai meteorological gradient towers during 2010-2013. [Method] Based on minute observation data of 9 meteorological gradient towers in Shanghai during 2010-2013, aiming at observational elements such as temperature, relative humidity, horizontal wind direction and wind speed, according to vertical observation features of gradient towers, data quality control model was established, comprehensive quality control of gradient data was conducted; data was evaluated from aspects of acquisition rate, false rate and validity. [Result] The results showed that data receiving, storage in 2010 is most complete, the worst in 2011; air temperature, wind speed of the observed data anomalies are less, the humidity and wind direction data is more abnormal; extreme control check out a lot of temperature anomalies; minute and hour continuity can check temperature and relative humidity in the abnormal jump; dead value inspection plays an important role in quality control of each element. [Conclusion] The study can provide more accurate and objective gradient observation data for research on the structure characteristics of air temperature in the near surface layer in Shanghai.
Key wordsMeteorological gradient observation tower; Observation data; Quality control; Operation evaluation
如何获取真实准确的气象观测数据,识别出异常情况并对其进行订正,尽可能再现原有探测环境和气象状况,是开展各项气象业务首先必需解决的问题。天气系统的局部不稳定性、观测环境的复杂性、电子仪器的不确定性、数据处理技术的差异以及通讯传输过程中的误差等众多因素均有可能造成观测数据的异常。WMO对气象资料质量控制非常重视且已经有了很多指导性的意见[1-2]。
气象梯度观测塔可以实现近地面多要素的垂直立体连续观测,即不同高度的气温、相对湿度、水平风向和水平风速等。在大气边界层特别是近地层的研究中,梯度观测是为数不多可以提供丰富、详实资料的直接观测手段,其资料的连续性也是其他观测方式难以比拟的,为环境评价和局地小气候研究提供了必不可少的气象数据资料[3-7]。在风能资源评估、大气污染扩散、海陆风特征研究等方面,国内外已有一定的研究并取得了较好的应用成果[8-9]。由于梯度观测塔属于无人值守的野外观测设备,观测数据质量可能会受到多方面因素的影响。研究梯度观测资料的质量控制问题,将对边界层直接观测资料的质量控制具有一定的促进和借鉴意义。但鉴于风要素的矢量特性以及边界层不规则湍流和扰动的存在,现有的相关质控方法还相对比较宽泛,主要是气象学极值、仪器观测范围及僵值等。国内针对自动气象站的历史观测资料和实时观测资料的质量控制已进行了大量的研究和尝试,在实际的业务系统中,国家局也已推出了气象资料实时历史一体化平台(MDOS),可实时对自动气象站的观测数据进行质量控制[10-12]。而针对梯度观测塔的资料质量控制研究不多,原因可能是因为相对自动气象站而言,梯度站点的建设较为稀疏,其相应的管理维护未能得到足够的重视;梯度观测数据的实际应用较少,在科研和业务中未能充分发挥效用。笔者基于上海地区现有的9座气象梯度观测塔2010~2013年的分钟级观测数据,针对气温、相对湿度、水平风向和水平风速等观测要素,开展了梯度观测数据质量控制的探索与尝试,对不同质控方法的适用性进行了初步分析,并从数据获取率、数据疑误率、数据有效性等方面对梯度塔的历史观测数据进行了统计及评估,分析了部分天气对不同观测要素数据的质量影响。 1资料与方法
1.1上海梯度观测系统现状目前,上海已建9座气象梯度观测塔(浦东、宝山、松江等),基本实现了一区一塔(图1)。硬件设备为无锡无线电科学研究所有限公司生产的ZQZ-NT系列梯度观测系统,供电方式为交流220 V,所有的站点均采用GPRS通信方式,数据观测频率为1次/min。梯度观测设备具备防盐雾腐蚀、防尘和防老化能力,可进行多层的子系统配置以实现多要素同时观测,每层子系统可以同时接入相应的气象传感器(水平风向、水平风速、气温、相对湿度等)。上海已建的9座气象梯度观测塔均统一以各区县现有的电视铁塔为载体,从低到高设置为5层观测,每个高度的观测要素分别为10 m(WD、WS、T、RH)、30 m(WD、WS)、50 m(WD、WS)、70 m(WD、WS、T)、100 m(WD、WS),其中WD代表水平风向、WS代表水平风速、T代表气温、RH代表相对湿度。9座梯度塔所采用的传感器基本为统一型号,这不仅有利于后期的设备维护,也为各个站点数据间的应用提供了可比对的基础。气象梯度观测塔传感器配置情况如表1所示。
2010年,上海完成了全市梯度塔观测系统的建设并进入了稳定的组网观测阶段。2013年9月前后,9个梯度观测塔的所有传感器均得到了一次全面的维护维修以确保每个站点所有的要素传感器均能正常运行。巡检中也发现了部分站点存在电缆线严重老化的问题,其中嘉定、宝山、浦东和崇明等4个站点可能是受到了雷击的影响,造成了设备不同程度的损坏,甚至造成了采集器故障瘫痪,导致了较长时间的设备无观测记录。此外,部分站点的横臂、风速和风向传感器也存在不同程度的故障,对观测数据的质量也产生了一定的影响。而设备相关的元数据缺失(如故障的确切原因、故障发生的起止时间、实际操作的相关记录缺失等),对后期的数据应用研究也造成了一定的影响。
1.2梯度观测数据获取率计算自建站以来,所有站点的梯度观测数据均以入库的方式长久保存。所研究的数据对象为9座梯度塔4年(2010~2013年)的分钟观测数据,引用数据获取率来表征梯度观测数据的获取状况。在一定程度上,通过数据获取率的计算也可得知观测设备的总体运行状况,其计算公式为:数据获取率=实际接收数据量应该接收数据数量×100%。该研究对于数据获取率的计算是针对某站点某分钟观测的整条记录,而非某一要素进行的统计。基于梯度观测塔历史观测分钟数据,根据数据获取率计算公式对2010~2013年梯度观测数据进行了相应的统计和分析。
1.3梯度观测数据质量控制算法气象观测资料的实时质量控制方法基本可以分为单站质量控制和空间质量控制两大类,即时间上和空间上的二维复合控制。单站质量控制方法又可以细分为气候极值控制、地域极值质量控制、时间连续性控制和内部一致性控制等。基于前期的梯度数据质量控制工作,如缺测字符的处理、采集时间的合理性判断、字符的合法性判断等,这些在数据原始入库阶段已经成功地进行了处理和控制。在此着重对于入库后的观测数据进行进一步的质量控制,即对各观测要素测量值的气候-地域极值、时间一致性、内部一致性、空间一致性以及风速随高度的变化规律等进行核验,并为每一种质量控制方法设定了相应的质量控制码,详细记载了数据质量控制结果以供数据使用人员参考。此外,在进行质量控制方法应用的过程中,对不同要素的各质控方法的适用性进行了初步分析。
极值控制是最直接也是最有效的一个质量控制环节。梯度观测的每一个要素均有其固有的气候极值范围。而对于某个固定的区域,每个要素随着季节和天气变化又会显现出不同的地域特色,如气温的季节变化、湿度的地域差异等。考虑到极端天气出现的可能性,允许新的历史极值的出现,对阈值进行了一定尺度的拓展(上下极值放宽尺度为历史极值的5%)以减少误判。
根据气候要素的自然变化规律,在相邻的时间段内要素变化幅度必然在一定的波动范围内,2次观测数据之间的相关性和间隔的时间长短有密切关系。在此采用了分钟连续性变化、小时连续性变化以及最小变率检查等3种以时间为线索的控制方法。对于不同的要素而言,造成数据长期不变的原因也不尽相同。如在研究过程中发现,湿度传感器在高湿的情况下,尤其是在相对湿度接近100%时,有不退湿现象。如果出现大雾天气或雨天,湿度值可能在较长的时间内不发生数值变化。而对于风速而言,如果某个自动站的启动风速较大,在环境风比较小的情况下,风速长期为0 m/s。
内部一致性检查是根据气象要素之间的逻辑关系,对同一个站点同一个时刻相关要素之间的气象学相关性进行的一项对比,以检查他们之间是否存在矛盾现象,如2 min平均风速和10 min平均风速之间的比对、风向风速要素之间的联动反应(风向为0或不变化的同时,风速不等于0或存在变动)。
理论上,地理自然环境相仿且距离相近的区域内,气象数据理想状态下也应该基本相似(排除一些人为或意外影响因素),观测数据具有高度的可比性。对于孤立的错误资料或时间尺度上无法识别的异常变化趋势,如对于同一个站点不同高度的相同要素之间的比较、梯度塔和邻近自动气象站点之间相同要素的比较,空间一致性质量控制方法可以起到很好的监控作用。
该研究所采用的部分质量控制方法如表2所示。每一个要素所采用的质量控制方法有所区别,即便是相同的质控方法,每个要素采取的具体措施也不尽相同。气温、相对湿度还采取了奇异值检查、标准方差判断等作为辅助判断方法。此外,针对风向要素的判别,依照梯度观测多层的特点,将每个时刻的风向进行了不同象限的分割,以此来判断在同一时刻、不同高度上的风向是否较为接近,如果有明显异常于上下相邻两层的风向数值也将在质量控制标记位里作相应的记录(正常情况下,5层的风向应该大体一致,在上下相距40 m的尺度范围内,单层受到明显异常扰动的可能性较小)。
2结果与分析
2.1梯度观测数据接收、存储状况 2.1.1数据获取率的站点差异。从计算结果来看,上海9座梯度塔的数据总体情况良好,平均数据获取率达87%(图2)。如果排除嘉定(56.77%),其余8个站点4年总的数据平均获取率可达91%,崇明及浦东2个站点也相对较差,实际观测数据显示这3个站点均存在长期观测异常的情况。其中,嘉定站点2010年8月~2011年5月、2012年9月~2013年2月设备故障,导致所有数据缺测;浦东站点2013年3~8月缺测;崇明站点2011年1~5月缺测;而闵行、松江、奉贤、青浦的4年数据平均获取率均在95%以上,运行状态良好,数据获取率相对稳定,统计显示这4个站点在不同年份之间的变化也较小,说明这4个站点的观测设备状态较好,数据的完整性将有利于后期的数据研究与应用。
总体来说,上海9个气象梯度观测站点之间的数据获取情况存在一定的差异。根据站点所在的地理位置(图1),数据获取率较差的5个站点(嘉定、崇明、浦东、金山和宝山)中有4个位于上海北部,这块区域也恰好与上海雷电高发区域的统计相吻合,雷电是否是造成设备故障的主要原因还有待于进一步的验证,而设备故障后的维护不及时造成的数据较长时间的缺失对后期的数据应用造成了一定的局限性。
2.1.2数据获取率的时间差异。2010~2013年9个站点的年平均数据获取率依次为91.98%、81.72%、89.01%、85.24%。其中,2010年度最高,比4年的总平均值(87%)高出了近5个百分点;但年度之间并未发现有特定的规律存在,数据获取率的波动主要取决于设备运行的状态。由图3可见,2010~2013年不同的月份数据获取率的差别也不是很明显,且无明显的季节性变化规律,从一定程度上说明梯度观测数据受季节性影响较小。这是由梯度观测所采用的传感器以及所观测的气象要素的特点所共同决定的。1、8月的数据获取率相对较低,部分是由于这2个月份的部分站点存在长期的数据缺测而导致。对于2010~2013年每年所有站点的综合月平均数据获取率而言,不同的年份同一个月份里数据获取率不尽相同且变化趋势也是各异。以松江站点为例(图4),各站点每天的数据获取率也均存在一定幅度的波动。
根据数据获取率来评估设备的运行状况,虽然不一定能够百分百的正确体现,但可以基本反映设备的实际状态。现有数据统计表明,部分站点由于存在长时间的缺测导致这些站点的数据应用将存在一定的局限性,限制了现有观测网络效益的发挥。某些站点存在长达数月的故障,从一定程度上来说也暴露了设备管理及维护工作的缺失。2013年7~9月针对全市9个气象梯度观测塔开展了一次全面的维修和维护工作,所有站点的数据平均获取率统一回升,平均达98.44%。因此,气象梯度观测设备的日常维护和校准是保障和提升观测系统效益的基础条件和必要措施,也是提高观测数据质量非常重要的环节。
2.2梯度数据质量控制基于上述的数据质量控制(表2)之后,2010~2013年各要素综合异常数据比例分别为10 m高度气温数据疑误率为1.06%,70 m高度气温数据疑误率为0.51%,10 m高度相对湿度数据疑误率为12.98%。各高度层的水平风向、水平风速数据的疑误比率(表3)显示,水平风速数据的异常数据比例小于水平风向;2和10 min平均风速在同一高度上的异常数据比例接近,具有较高的相关性;2和10 min平均风向也有这一特点。对于风速要素来说,低层高度的数据异常情况比高层高度的数据多,如10 m高度的2 min平均风速的总体疑误率为5.26%,而100 m高度的异常比例仅为1.47%。总体来说,气温、风速数据的异常比例较低,而湿度和风向要素的异常比例较高。质控结果显示,异常数据的故障主要以数据僵值为主。为了进一步说明气象梯度塔观测数据质量控制的情况,下面以要素分类逐个说明各站点的质量控制结果。这里所有的异常数据统计中并不包括缺测数据的统计。
2.2.1气温。气温数据的质量控制步骤包括了极值控制、分钟连续性检查、小时连续性检查、僵值检查、奇异值判断、逆温标记、不同高度(10~70 m)气温联合检验等方法,气温数据异常主要集中在以下3个方面:①超出极值故障,如嘉定站点在2013年5月20日凌晨,10 m高度的气温始终为-42 ℃左右,超出了气候和地域极值范围;宝山、奉贤站点也存在类似故障记录。②僵值故障,夜里气温数值在较长时间内保持不变(特别是冬季)。③异常跳变,气温在较短的时间里急剧跳变(下降)。
经分析(表4),2010~2013年上海各站点气温异常数据总体占1.06%,除奉贤5.67%、宝山1.28%、闵行1.41%以外,其他6个站点4年气温异常数据比例仅为0.22%。其中,2010年的温度年度平均异常比例为0.16%,为4年最低。总体来说,10 m温度的数据异常主要是由于未通过极值控制、小时连续性检查和僵值检查。除了极值故障和僵值情况之外,气温在夏季存在较多的异常跳变情况,原因可能是由于夏季强对流天气下,突发阵性降水导致的气温急剧跳变(下降)超出了正常的气温时间变化规律。如2010年8月15日松江站点的温度从17:00的35.1 ℃急剧下降至18:00的26.5 ℃,在正常的天气状况下如此剧烈的温度跳变是不太可能出现的。利用各梯度塔周边的自动气象站(国家一般站)降水数据对存在气温跳变的数据进行了复合验证,当有较强的突发性阵性降水时,10和70 m高度的气温均可能发生相似程度的气温跳变且常超出了常态的时间一致性的阈值范围。这一现象也证明了夏季突发降水情况下气温跳变的客观存在。在做类似数据自动质量控制时,辅以局地降水数据的联合判断,有益于减少合理“异常”的误判。
2.2.2相对湿度。相对湿度的质量方法和流程基本与气温类似。其中,僵值检查的结果尤为突出,而极值检查、奇异值的判断未发现异常数据。在分钟连续性检查和小时连续性检查中,仅个别站点(奉贤、青浦)出现极少量的异常数据。2010~2013年上海9个站点10 m高度的相对湿度异常数据比率为12.98%,除奉贤(61.56%)和嘉定(25.17%)外,其余7个站点的4年相对湿度异常比例仅为4.3%,而宝山站点的2013年相对湿度数据质量较前面3年略有下降(图5)。相对湿度异常的主要原因是湿度传感器在高湿情况下退湿较慢,造成了一定时间内相对湿度长期保持某一数值不变。笔者在做相对湿度僵值判断时,区分了高湿(>75%)和常态湿度(≤75%)以区别对待降水天气和晴空(包括阴天)的情况。即便是在相对湿度<75%的情况,部分站点(奉贤、嘉定)依然存在相对湿度僵值的情况,如奉贤站点在2010年12月16日03:00~次日03:00相对湿度始终保持为71%不变。参考临近的奉贤区自动气象站数据得知,当日无降水且自动气象站的相对湿度值最低时仅为42%(2010年12月16日11:00)。由此可知,奉贤站点的相对湿度数据在该时间段可信度不高。此外,针对相对湿度>75%的情况(图6),夏季的异常数据相对较多,特别是6月份前后,这大体与上海梅雨期所处的时间段较为接近,连绵的阴雨天气造成的高湿环境导致了湿度传感器退湿困难。 2.2.3水平风速和水平风向。鉴于气象梯度观测塔特殊的垂直分层观测结构,不同高度的风向风速运转情况基本类似,针对每一层风向、风速所采取的质量控制方法(极值检查、小时连续性检查、空间一致性检查、内部一致性检查、僵值检查等)也相类似,但风向风速各自所采用的具体质量控制方法略有差异。质控处理的对象包括各个观测高度上的2 min平均风速、风向和10 min极大风速、风向。根据质量控制的结果可知,同一高度上的2 min数据和10 min数据的质量控制结果具有高度的相关性,这也符合了这2个要素内在的关联规律。因此,以下仅针对2 min平均风速、风向的相关质量控制结果进行分析。
由表5可见,2010~2013年上海9个站点10 m高度2 min平均风速异常数据平均达5.26%;2010年度10 m高度2 min分钟平均风速是最差的,主要是因为浦东风速传感器故障,数据长期存在僵值而造成的,其他8个站点之间异常的比例较为平均,总体情况良好。10 m高度2 min平均风向4年异常数据平均为15.76%。与风速类似,风向异常数据主要是存在僵值,即在一定的时段内风向数值长期保持不变。如奉贤站点的50 m高度2 min平均风向在2010年6月1~3日始终为0(该高度的风向传感器故障),而其他4层(10、30、70、100 m)的风向数据变化趋势相近(图7)。梯度风的各观测要素之间是相互独立,各层之间也是相互独立的。因此,在同一时刻奉贤站点各高度上的2 min平均风速观测却显示正常,风速随着观测高度的升高而增大,不同高度之间的变化趋势保持一致且昼夜间的变化也较有规律。
2010~2013年上海9个站点风向的异常数据结果与风速不太相同。风速的异常数据几乎是每个站点每年均会出现,只是数值上有所变动;而风向却相对集中在某个站点的某个时间段内,部分站点4年均未曾出现异常数据。存在这样差异的原因是风向风速2个要素的特性有所差别、所用质量控制方法也有差异。鉴于风向要素的特殊性,其可应用的质量控制方法相对较少,客观上导致了质控结果中异常数据也相对较少出现。此外,在4年的风要素质控结果中未发现超过极值范围的观测数据,究其原因:①观测数据入库时经过了合理性检查;②梯度塔的观测仍然属于近地面,且大多处于内陆位置,环境风很少出现大值的情况,整体风速较为平缓。即便在夏季台风影响期间,历史数据显示各个站点的风速也相对稳定。
3结论与讨论
该研究遴选多种气象数据质量控制算法对上海已建9座气象梯度观测塔的多要素观测历史数据进行了综合质量控制并对设备运行状况、观测数据质量进行统计、分析及评估。结果表明,2010年度的数据接收、存储最为完整,2011年度最差;观测设备的定期维护及校准显得尤为重要,完备的设备维护及保障机制是提高观测数据质量的必要前提和基础;闵行、松江、奉贤和青浦4个站点数据缺测较少,嘉定站点数据缺测较为严重;气温、风速2个要素的观测数据异常情况较少,湿度和风向数据的异常较多;数据检查中,僵值、连续性异常和极值故障等问题较为集中;各个站点的数据质量差异较大,同一站点不同要素、不同年份间也存在一定的差异。总体来说,闵行、松江、奉贤和青浦较为理想,但也存在某个高度的风向风速质控结果较差的现象。研究结果为类似观测设备的质量控制及评估工作提供了可借鉴的方法和经验,所标注的数据质量控制码可以为后续的数据推广应用提供必要的质控技术支撑。
针对不同的观测要素,各类质量控制方法的有效性如下:①极值控制检查出了较多的气温异常情况;②分钟连续性和小时连续性可以检查出气温以及相对湿度的异常跳变;③在所尝试的多个质量控制方法中,僵值检查(最小变率检查)可在每一个要素的质量控制中发挥出重要的作用;④空间一致性方法可以发挥梯度观测塔多层观测的结构特点,将同一要素同一时刻不同高度观测的值进行比对应用,可以找出常规质量控制方法无法识别的异常或故障。此外,利用相邻自动气象站的降水数据,可以辅助判别气温的异常跳变、湿度长期不退等异常现象,可避免将合理的“异常数据”当成错误的数据。
该研究在梯度数据的质量控制研究中以常规的质量控制方法为主,辅以不同天气条件、不同观测要素适用质控方法的遴选和验证,对晴天、夏季突发阵性降水、梅雨天气等进行了初步的个例分析,所得到的质控结果及评估结论仅限于文中所应用的质量控制方法及上海2010~2013年梯度观测的相关历史数据。有关质控方法的适用性、可用性分析不够全面,如何选取并融合不同的质量控制方法、如何设置更为科学有效的阈值还有待于进一步开展相关研究工作。
参考文献
[1]
熊安元.北欧气象观测资料的质量控制研究[J].气象科技,2003,31(5):314-320.
[2] World Meteorological Organization. CBS/OPAG-IOS/ET AWS-3/Doc.4(1). Guidelines on Quality Control Procedures for Data from Automatic Weather Stations[R]. WMO-No 305, 2004.
[3] 陈明,洪钟祥.大气边界层观测资料的质量控制方案及其应用[J].大气科学,1993,17(1):97-105.
[4] 马亮,许丽人,李鲲.铁塔近地层风场特征研究[J].装备环境工程,2010,7(5):20-28.
[5] 季崇萍,邹捍,张美根,等.城市化进程对近地层大气风温结构的影响[J].中国海洋大学学报,2011,41(7/8):17-23.
[6] 郭凤霞,朱文越,饶瑞中.非均一地形近地层风速廓线特点及粗糙度的研究[J].气象,2010,36(6):90-94.
[7] 王超,韦志刚,李振朝.敦煌戈壁地区近地层风的变化特征[J].高原气象,2011,30(2):299-308.
[8] 孙川永,陶树旺,罗勇,等.海陵岛区域风速廓线特性及利用模式进行沿海风能评估过程中风速廓线的作用[J].太阳能学报,2009,30(10):1396-1400.
[9] 陈训来,王安宇,李江南,等.香港地区海陆风的显式模拟研究[J].气象科学,2007,27(5):473-480.
[10] 王伯民.基本气象资料质量控制综合判别法的研究[J].应用气象学报,2004,15(B12):50-59.
[11] 任芝花,熊安元.地面自动站观测资料三级质量控制业务系统的研制[J].气象,2007,33(1):19-24.
[12] 王海军,杨志彪,杨代才,等.自动气象站实时资料自动质量控制方法及其应用[J].气象,2007,33(10):102-109.
关键词气象梯度塔;观测数据;质量控制;运行评估
中图分类号S16文献标识码
A文章编号0517-6611(2016)08-228-06
Abstract[Objective] The aim was to evaluate observational data quality and equipment operation performance in Shanghai meteorological gradient towers during 2010-2013. [Method] Based on minute observation data of 9 meteorological gradient towers in Shanghai during 2010-2013, aiming at observational elements such as temperature, relative humidity, horizontal wind direction and wind speed, according to vertical observation features of gradient towers, data quality control model was established, comprehensive quality control of gradient data was conducted; data was evaluated from aspects of acquisition rate, false rate and validity. [Result] The results showed that data receiving, storage in 2010 is most complete, the worst in 2011; air temperature, wind speed of the observed data anomalies are less, the humidity and wind direction data is more abnormal; extreme control check out a lot of temperature anomalies; minute and hour continuity can check temperature and relative humidity in the abnormal jump; dead value inspection plays an important role in quality control of each element. [Conclusion] The study can provide more accurate and objective gradient observation data for research on the structure characteristics of air temperature in the near surface layer in Shanghai.
Key wordsMeteorological gradient observation tower; Observation data; Quality control; Operation evaluation
如何获取真实准确的气象观测数据,识别出异常情况并对其进行订正,尽可能再现原有探测环境和气象状况,是开展各项气象业务首先必需解决的问题。天气系统的局部不稳定性、观测环境的复杂性、电子仪器的不确定性、数据处理技术的差异以及通讯传输过程中的误差等众多因素均有可能造成观测数据的异常。WMO对气象资料质量控制非常重视且已经有了很多指导性的意见[1-2]。
气象梯度观测塔可以实现近地面多要素的垂直立体连续观测,即不同高度的气温、相对湿度、水平风向和水平风速等。在大气边界层特别是近地层的研究中,梯度观测是为数不多可以提供丰富、详实资料的直接观测手段,其资料的连续性也是其他观测方式难以比拟的,为环境评价和局地小气候研究提供了必不可少的气象数据资料[3-7]。在风能资源评估、大气污染扩散、海陆风特征研究等方面,国内外已有一定的研究并取得了较好的应用成果[8-9]。由于梯度观测塔属于无人值守的野外观测设备,观测数据质量可能会受到多方面因素的影响。研究梯度观测资料的质量控制问题,将对边界层直接观测资料的质量控制具有一定的促进和借鉴意义。但鉴于风要素的矢量特性以及边界层不规则湍流和扰动的存在,现有的相关质控方法还相对比较宽泛,主要是气象学极值、仪器观测范围及僵值等。国内针对自动气象站的历史观测资料和实时观测资料的质量控制已进行了大量的研究和尝试,在实际的业务系统中,国家局也已推出了气象资料实时历史一体化平台(MDOS),可实时对自动气象站的观测数据进行质量控制[10-12]。而针对梯度观测塔的资料质量控制研究不多,原因可能是因为相对自动气象站而言,梯度站点的建设较为稀疏,其相应的管理维护未能得到足够的重视;梯度观测数据的实际应用较少,在科研和业务中未能充分发挥效用。笔者基于上海地区现有的9座气象梯度观测塔2010~2013年的分钟级观测数据,针对气温、相对湿度、水平风向和水平风速等观测要素,开展了梯度观测数据质量控制的探索与尝试,对不同质控方法的适用性进行了初步分析,并从数据获取率、数据疑误率、数据有效性等方面对梯度塔的历史观测数据进行了统计及评估,分析了部分天气对不同观测要素数据的质量影响。 1资料与方法
1.1上海梯度观测系统现状目前,上海已建9座气象梯度观测塔(浦东、宝山、松江等),基本实现了一区一塔(图1)。硬件设备为无锡无线电科学研究所有限公司生产的ZQZ-NT系列梯度观测系统,供电方式为交流220 V,所有的站点均采用GPRS通信方式,数据观测频率为1次/min。梯度观测设备具备防盐雾腐蚀、防尘和防老化能力,可进行多层的子系统配置以实现多要素同时观测,每层子系统可以同时接入相应的气象传感器(水平风向、水平风速、气温、相对湿度等)。上海已建的9座气象梯度观测塔均统一以各区县现有的电视铁塔为载体,从低到高设置为5层观测,每个高度的观测要素分别为10 m(WD、WS、T、RH)、30 m(WD、WS)、50 m(WD、WS)、70 m(WD、WS、T)、100 m(WD、WS),其中WD代表水平风向、WS代表水平风速、T代表气温、RH代表相对湿度。9座梯度塔所采用的传感器基本为统一型号,这不仅有利于后期的设备维护,也为各个站点数据间的应用提供了可比对的基础。气象梯度观测塔传感器配置情况如表1所示。
2010年,上海完成了全市梯度塔观测系统的建设并进入了稳定的组网观测阶段。2013年9月前后,9个梯度观测塔的所有传感器均得到了一次全面的维护维修以确保每个站点所有的要素传感器均能正常运行。巡检中也发现了部分站点存在电缆线严重老化的问题,其中嘉定、宝山、浦东和崇明等4个站点可能是受到了雷击的影响,造成了设备不同程度的损坏,甚至造成了采集器故障瘫痪,导致了较长时间的设备无观测记录。此外,部分站点的横臂、风速和风向传感器也存在不同程度的故障,对观测数据的质量也产生了一定的影响。而设备相关的元数据缺失(如故障的确切原因、故障发生的起止时间、实际操作的相关记录缺失等),对后期的数据应用研究也造成了一定的影响。
1.2梯度观测数据获取率计算自建站以来,所有站点的梯度观测数据均以入库的方式长久保存。所研究的数据对象为9座梯度塔4年(2010~2013年)的分钟观测数据,引用数据获取率来表征梯度观测数据的获取状况。在一定程度上,通过数据获取率的计算也可得知观测设备的总体运行状况,其计算公式为:数据获取率=实际接收数据量应该接收数据数量×100%。该研究对于数据获取率的计算是针对某站点某分钟观测的整条记录,而非某一要素进行的统计。基于梯度观测塔历史观测分钟数据,根据数据获取率计算公式对2010~2013年梯度观测数据进行了相应的统计和分析。
1.3梯度观测数据质量控制算法气象观测资料的实时质量控制方法基本可以分为单站质量控制和空间质量控制两大类,即时间上和空间上的二维复合控制。单站质量控制方法又可以细分为气候极值控制、地域极值质量控制、时间连续性控制和内部一致性控制等。基于前期的梯度数据质量控制工作,如缺测字符的处理、采集时间的合理性判断、字符的合法性判断等,这些在数据原始入库阶段已经成功地进行了处理和控制。在此着重对于入库后的观测数据进行进一步的质量控制,即对各观测要素测量值的气候-地域极值、时间一致性、内部一致性、空间一致性以及风速随高度的变化规律等进行核验,并为每一种质量控制方法设定了相应的质量控制码,详细记载了数据质量控制结果以供数据使用人员参考。此外,在进行质量控制方法应用的过程中,对不同要素的各质控方法的适用性进行了初步分析。
极值控制是最直接也是最有效的一个质量控制环节。梯度观测的每一个要素均有其固有的气候极值范围。而对于某个固定的区域,每个要素随着季节和天气变化又会显现出不同的地域特色,如气温的季节变化、湿度的地域差异等。考虑到极端天气出现的可能性,允许新的历史极值的出现,对阈值进行了一定尺度的拓展(上下极值放宽尺度为历史极值的5%)以减少误判。
根据气候要素的自然变化规律,在相邻的时间段内要素变化幅度必然在一定的波动范围内,2次观测数据之间的相关性和间隔的时间长短有密切关系。在此采用了分钟连续性变化、小时连续性变化以及最小变率检查等3种以时间为线索的控制方法。对于不同的要素而言,造成数据长期不变的原因也不尽相同。如在研究过程中发现,湿度传感器在高湿的情况下,尤其是在相对湿度接近100%时,有不退湿现象。如果出现大雾天气或雨天,湿度值可能在较长的时间内不发生数值变化。而对于风速而言,如果某个自动站的启动风速较大,在环境风比较小的情况下,风速长期为0 m/s。
内部一致性检查是根据气象要素之间的逻辑关系,对同一个站点同一个时刻相关要素之间的气象学相关性进行的一项对比,以检查他们之间是否存在矛盾现象,如2 min平均风速和10 min平均风速之间的比对、风向风速要素之间的联动反应(风向为0或不变化的同时,风速不等于0或存在变动)。
理论上,地理自然环境相仿且距离相近的区域内,气象数据理想状态下也应该基本相似(排除一些人为或意外影响因素),观测数据具有高度的可比性。对于孤立的错误资料或时间尺度上无法识别的异常变化趋势,如对于同一个站点不同高度的相同要素之间的比较、梯度塔和邻近自动气象站点之间相同要素的比较,空间一致性质量控制方法可以起到很好的监控作用。
该研究所采用的部分质量控制方法如表2所示。每一个要素所采用的质量控制方法有所区别,即便是相同的质控方法,每个要素采取的具体措施也不尽相同。气温、相对湿度还采取了奇异值检查、标准方差判断等作为辅助判断方法。此外,针对风向要素的判别,依照梯度观测多层的特点,将每个时刻的风向进行了不同象限的分割,以此来判断在同一时刻、不同高度上的风向是否较为接近,如果有明显异常于上下相邻两层的风向数值也将在质量控制标记位里作相应的记录(正常情况下,5层的风向应该大体一致,在上下相距40 m的尺度范围内,单层受到明显异常扰动的可能性较小)。
2结果与分析
2.1梯度观测数据接收、存储状况 2.1.1数据获取率的站点差异。从计算结果来看,上海9座梯度塔的数据总体情况良好,平均数据获取率达87%(图2)。如果排除嘉定(56.77%),其余8个站点4年总的数据平均获取率可达91%,崇明及浦东2个站点也相对较差,实际观测数据显示这3个站点均存在长期观测异常的情况。其中,嘉定站点2010年8月~2011年5月、2012年9月~2013年2月设备故障,导致所有数据缺测;浦东站点2013年3~8月缺测;崇明站点2011年1~5月缺测;而闵行、松江、奉贤、青浦的4年数据平均获取率均在95%以上,运行状态良好,数据获取率相对稳定,统计显示这4个站点在不同年份之间的变化也较小,说明这4个站点的观测设备状态较好,数据的完整性将有利于后期的数据研究与应用。
总体来说,上海9个气象梯度观测站点之间的数据获取情况存在一定的差异。根据站点所在的地理位置(图1),数据获取率较差的5个站点(嘉定、崇明、浦东、金山和宝山)中有4个位于上海北部,这块区域也恰好与上海雷电高发区域的统计相吻合,雷电是否是造成设备故障的主要原因还有待于进一步的验证,而设备故障后的维护不及时造成的数据较长时间的缺失对后期的数据应用造成了一定的局限性。
2.1.2数据获取率的时间差异。2010~2013年9个站点的年平均数据获取率依次为91.98%、81.72%、89.01%、85.24%。其中,2010年度最高,比4年的总平均值(87%)高出了近5个百分点;但年度之间并未发现有特定的规律存在,数据获取率的波动主要取决于设备运行的状态。由图3可见,2010~2013年不同的月份数据获取率的差别也不是很明显,且无明显的季节性变化规律,从一定程度上说明梯度观测数据受季节性影响较小。这是由梯度观测所采用的传感器以及所观测的气象要素的特点所共同决定的。1、8月的数据获取率相对较低,部分是由于这2个月份的部分站点存在长期的数据缺测而导致。对于2010~2013年每年所有站点的综合月平均数据获取率而言,不同的年份同一个月份里数据获取率不尽相同且变化趋势也是各异。以松江站点为例(图4),各站点每天的数据获取率也均存在一定幅度的波动。
根据数据获取率来评估设备的运行状况,虽然不一定能够百分百的正确体现,但可以基本反映设备的实际状态。现有数据统计表明,部分站点由于存在长时间的缺测导致这些站点的数据应用将存在一定的局限性,限制了现有观测网络效益的发挥。某些站点存在长达数月的故障,从一定程度上来说也暴露了设备管理及维护工作的缺失。2013年7~9月针对全市9个气象梯度观测塔开展了一次全面的维修和维护工作,所有站点的数据平均获取率统一回升,平均达98.44%。因此,气象梯度观测设备的日常维护和校准是保障和提升观测系统效益的基础条件和必要措施,也是提高观测数据质量非常重要的环节。
2.2梯度数据质量控制基于上述的数据质量控制(表2)之后,2010~2013年各要素综合异常数据比例分别为10 m高度气温数据疑误率为1.06%,70 m高度气温数据疑误率为0.51%,10 m高度相对湿度数据疑误率为12.98%。各高度层的水平风向、水平风速数据的疑误比率(表3)显示,水平风速数据的异常数据比例小于水平风向;2和10 min平均风速在同一高度上的异常数据比例接近,具有较高的相关性;2和10 min平均风向也有这一特点。对于风速要素来说,低层高度的数据异常情况比高层高度的数据多,如10 m高度的2 min平均风速的总体疑误率为5.26%,而100 m高度的异常比例仅为1.47%。总体来说,气温、风速数据的异常比例较低,而湿度和风向要素的异常比例较高。质控结果显示,异常数据的故障主要以数据僵值为主。为了进一步说明气象梯度塔观测数据质量控制的情况,下面以要素分类逐个说明各站点的质量控制结果。这里所有的异常数据统计中并不包括缺测数据的统计。
2.2.1气温。气温数据的质量控制步骤包括了极值控制、分钟连续性检查、小时连续性检查、僵值检查、奇异值判断、逆温标记、不同高度(10~70 m)气温联合检验等方法,气温数据异常主要集中在以下3个方面:①超出极值故障,如嘉定站点在2013年5月20日凌晨,10 m高度的气温始终为-42 ℃左右,超出了气候和地域极值范围;宝山、奉贤站点也存在类似故障记录。②僵值故障,夜里气温数值在较长时间内保持不变(特别是冬季)。③异常跳变,气温在较短的时间里急剧跳变(下降)。
经分析(表4),2010~2013年上海各站点气温异常数据总体占1.06%,除奉贤5.67%、宝山1.28%、闵行1.41%以外,其他6个站点4年气温异常数据比例仅为0.22%。其中,2010年的温度年度平均异常比例为0.16%,为4年最低。总体来说,10 m温度的数据异常主要是由于未通过极值控制、小时连续性检查和僵值检查。除了极值故障和僵值情况之外,气温在夏季存在较多的异常跳变情况,原因可能是由于夏季强对流天气下,突发阵性降水导致的气温急剧跳变(下降)超出了正常的气温时间变化规律。如2010年8月15日松江站点的温度从17:00的35.1 ℃急剧下降至18:00的26.5 ℃,在正常的天气状况下如此剧烈的温度跳变是不太可能出现的。利用各梯度塔周边的自动气象站(国家一般站)降水数据对存在气温跳变的数据进行了复合验证,当有较强的突发性阵性降水时,10和70 m高度的气温均可能发生相似程度的气温跳变且常超出了常态的时间一致性的阈值范围。这一现象也证明了夏季突发降水情况下气温跳变的客观存在。在做类似数据自动质量控制时,辅以局地降水数据的联合判断,有益于减少合理“异常”的误判。
2.2.2相对湿度。相对湿度的质量方法和流程基本与气温类似。其中,僵值检查的结果尤为突出,而极值检查、奇异值的判断未发现异常数据。在分钟连续性检查和小时连续性检查中,仅个别站点(奉贤、青浦)出现极少量的异常数据。2010~2013年上海9个站点10 m高度的相对湿度异常数据比率为12.98%,除奉贤(61.56%)和嘉定(25.17%)外,其余7个站点的4年相对湿度异常比例仅为4.3%,而宝山站点的2013年相对湿度数据质量较前面3年略有下降(图5)。相对湿度异常的主要原因是湿度传感器在高湿情况下退湿较慢,造成了一定时间内相对湿度长期保持某一数值不变。笔者在做相对湿度僵值判断时,区分了高湿(>75%)和常态湿度(≤75%)以区别对待降水天气和晴空(包括阴天)的情况。即便是在相对湿度<75%的情况,部分站点(奉贤、嘉定)依然存在相对湿度僵值的情况,如奉贤站点在2010年12月16日03:00~次日03:00相对湿度始终保持为71%不变。参考临近的奉贤区自动气象站数据得知,当日无降水且自动气象站的相对湿度值最低时仅为42%(2010年12月16日11:00)。由此可知,奉贤站点的相对湿度数据在该时间段可信度不高。此外,针对相对湿度>75%的情况(图6),夏季的异常数据相对较多,特别是6月份前后,这大体与上海梅雨期所处的时间段较为接近,连绵的阴雨天气造成的高湿环境导致了湿度传感器退湿困难。 2.2.3水平风速和水平风向。鉴于气象梯度观测塔特殊的垂直分层观测结构,不同高度的风向风速运转情况基本类似,针对每一层风向、风速所采取的质量控制方法(极值检查、小时连续性检查、空间一致性检查、内部一致性检查、僵值检查等)也相类似,但风向风速各自所采用的具体质量控制方法略有差异。质控处理的对象包括各个观测高度上的2 min平均风速、风向和10 min极大风速、风向。根据质量控制的结果可知,同一高度上的2 min数据和10 min数据的质量控制结果具有高度的相关性,这也符合了这2个要素内在的关联规律。因此,以下仅针对2 min平均风速、风向的相关质量控制结果进行分析。
由表5可见,2010~2013年上海9个站点10 m高度2 min平均风速异常数据平均达5.26%;2010年度10 m高度2 min分钟平均风速是最差的,主要是因为浦东风速传感器故障,数据长期存在僵值而造成的,其他8个站点之间异常的比例较为平均,总体情况良好。10 m高度2 min平均风向4年异常数据平均为15.76%。与风速类似,风向异常数据主要是存在僵值,即在一定的时段内风向数值长期保持不变。如奉贤站点的50 m高度2 min平均风向在2010年6月1~3日始终为0(该高度的风向传感器故障),而其他4层(10、30、70、100 m)的风向数据变化趋势相近(图7)。梯度风的各观测要素之间是相互独立,各层之间也是相互独立的。因此,在同一时刻奉贤站点各高度上的2 min平均风速观测却显示正常,风速随着观测高度的升高而增大,不同高度之间的变化趋势保持一致且昼夜间的变化也较有规律。
2010~2013年上海9个站点风向的异常数据结果与风速不太相同。风速的异常数据几乎是每个站点每年均会出现,只是数值上有所变动;而风向却相对集中在某个站点的某个时间段内,部分站点4年均未曾出现异常数据。存在这样差异的原因是风向风速2个要素的特性有所差别、所用质量控制方法也有差异。鉴于风向要素的特殊性,其可应用的质量控制方法相对较少,客观上导致了质控结果中异常数据也相对较少出现。此外,在4年的风要素质控结果中未发现超过极值范围的观测数据,究其原因:①观测数据入库时经过了合理性检查;②梯度塔的观测仍然属于近地面,且大多处于内陆位置,环境风很少出现大值的情况,整体风速较为平缓。即便在夏季台风影响期间,历史数据显示各个站点的风速也相对稳定。
3结论与讨论
该研究遴选多种气象数据质量控制算法对上海已建9座气象梯度观测塔的多要素观测历史数据进行了综合质量控制并对设备运行状况、观测数据质量进行统计、分析及评估。结果表明,2010年度的数据接收、存储最为完整,2011年度最差;观测设备的定期维护及校准显得尤为重要,完备的设备维护及保障机制是提高观测数据质量的必要前提和基础;闵行、松江、奉贤和青浦4个站点数据缺测较少,嘉定站点数据缺测较为严重;气温、风速2个要素的观测数据异常情况较少,湿度和风向数据的异常较多;数据检查中,僵值、连续性异常和极值故障等问题较为集中;各个站点的数据质量差异较大,同一站点不同要素、不同年份间也存在一定的差异。总体来说,闵行、松江、奉贤和青浦较为理想,但也存在某个高度的风向风速质控结果较差的现象。研究结果为类似观测设备的质量控制及评估工作提供了可借鉴的方法和经验,所标注的数据质量控制码可以为后续的数据推广应用提供必要的质控技术支撑。
针对不同的观测要素,各类质量控制方法的有效性如下:①极值控制检查出了较多的气温异常情况;②分钟连续性和小时连续性可以检查出气温以及相对湿度的异常跳变;③在所尝试的多个质量控制方法中,僵值检查(最小变率检查)可在每一个要素的质量控制中发挥出重要的作用;④空间一致性方法可以发挥梯度观测塔多层观测的结构特点,将同一要素同一时刻不同高度观测的值进行比对应用,可以找出常规质量控制方法无法识别的异常或故障。此外,利用相邻自动气象站的降水数据,可以辅助判别气温的异常跳变、湿度长期不退等异常现象,可避免将合理的“异常数据”当成错误的数据。
该研究在梯度数据的质量控制研究中以常规的质量控制方法为主,辅以不同天气条件、不同观测要素适用质控方法的遴选和验证,对晴天、夏季突发阵性降水、梅雨天气等进行了初步的个例分析,所得到的质控结果及评估结论仅限于文中所应用的质量控制方法及上海2010~2013年梯度观测的相关历史数据。有关质控方法的适用性、可用性分析不够全面,如何选取并融合不同的质量控制方法、如何设置更为科学有效的阈值还有待于进一步开展相关研究工作。
参考文献
[1]
熊安元.北欧气象观测资料的质量控制研究[J].气象科技,2003,31(5):314-320.
[2] World Meteorological Organization. CBS/OPAG-IOS/ET AWS-3/Doc.4(1). Guidelines on Quality Control Procedures for Data from Automatic Weather Stations[R]. WMO-No 305, 2004.
[3] 陈明,洪钟祥.大气边界层观测资料的质量控制方案及其应用[J].大气科学,1993,17(1):97-105.
[4] 马亮,许丽人,李鲲.铁塔近地层风场特征研究[J].装备环境工程,2010,7(5):20-28.
[5] 季崇萍,邹捍,张美根,等.城市化进程对近地层大气风温结构的影响[J].中国海洋大学学报,2011,41(7/8):17-23.
[6] 郭凤霞,朱文越,饶瑞中.非均一地形近地层风速廓线特点及粗糙度的研究[J].气象,2010,36(6):90-94.
[7] 王超,韦志刚,李振朝.敦煌戈壁地区近地层风的变化特征[J].高原气象,2011,30(2):299-308.
[8] 孙川永,陶树旺,罗勇,等.海陵岛区域风速廓线特性及利用模式进行沿海风能评估过程中风速廓线的作用[J].太阳能学报,2009,30(10):1396-1400.
[9] 陈训来,王安宇,李江南,等.香港地区海陆风的显式模拟研究[J].气象科学,2007,27(5):473-480.
[10] 王伯民.基本气象资料质量控制综合判别法的研究[J].应用气象学报,2004,15(B12):50-59.
[11] 任芝花,熊安元.地面自动站观测资料三级质量控制业务系统的研制[J].气象,2007,33(1):19-24.
[12] 王海军,杨志彪,杨代才,等.自动气象站实时资料自动质量控制方法及其应用[J].气象,2007,33(10):102-109.