【摘 要】
:
农业与环境各种介质(如土壤、水等)中重金属和异源性污染物分布极其不均匀,土壤与水中重金属痕量物质的浓度常低于检测方法的检测限(limit of detection/LOD),而不能准确知晓其含量;此类包含低于检测限信息的数据被称作删失数据,且以左删失为主。同时,由于分布不均匀该类数据经常呈偏态分布,这对单变量的参数估计与多变量之间的相关性估计造成挑战。本研究对两种典型偏分布的左删失数据进行了概率密
论文部分内容阅读
农业与环境各种介质(如土壤、水等)中重金属和异源性污染物分布极其不均匀,土壤与水中重金属痕量物质的浓度常低于检测方法的检测限(limit of detection/LOD),而不能准确知晓其含量;此类包含低于检测限信息的数据被称作删失数据,且以左删失为主。同时,由于分布不均匀该类数据经常呈偏态分布,这对单变量的参数估计与多变量之间的相关性估计造成挑战。本研究对两种典型偏分布的左删失数据进行了概率密度函数的推导并基于最大似然法建模,试图估计边缘分布的参数和联合分布的相关系数。通过模拟研究,评价各参数不同取值下似然估计值的准确性,分别了解了样本容量、删失比例、总体相关系数与干扰项等因素对相关系数估计值准确性的影响;并将MLE与替换法(通常将删失部分替换为LOD或LOD/2)和删除法(直接将删失部分删除)做对比,证明了其精准度的优越性。并将模型应用于澳大利亚土壤普查数据与青海湟水河流域重金属数据的相关性研究。最后,通过R语言中的shiny包构建web服务,为参数估计模型提供交互式图形界面,方便用户使用。结果表明:最大似然法可以准确地对对数正态分布的均值与标准差进行估计。均值与标准差的估计值随删失比例变化而常有着相反的变化趋势,当删失比例达到60%,均值与标准差估计值的准确性受到影响,但整体而言,有效估计的删失比例可达到80%。最大似然法对gamma分布的形状参数与逆尺度参数的估计偏差较小。删失比例达到70%时形状参数的估计值出现较大偏差,然而偏差基本保持在0.2以内,可以进行准确的参数估计。最大似然法对逆尺度参数的估计值较为稳定,可以在删失比例为80%以内进行准确的估计。样本容量、删失比例、总体相关系数和干扰项对左删失二维偏态分布数据参数估计准确性的影响较小。样本容量越大,研究中的MLE对左删失二维对数正态分布的相关系数的估计结果就越准确,当样本容量达到2000时,二维对数正态分布的相关系数估计值基本收敛。研究中的MLE的相关系数估计值随删失比例(0%到90%,间隔10%)与总体相关系数(-1到1间隔为0.1)变化,偏差程度较小,说明MLE具有渐进无偏性和一致性。干扰项的添加对研究中MLE的准确性有较小的影响,表明其有较强的鲁棒性。随着删失比例的提升,删除法和替换法的结果准确性变差,研究中的MLE方法精准性明显优于上述两种方法,即使删失比例达到80%仍可以进行有效估计(1000次重复研究估计值的RMSE<0.1)。研究中的MLE对左删失二维gamma分布的相关系数估计值相比于左删失二维对数正态分布样更加稳定。当样本容量达到500时,二维gamma分布的相关系数估计值收敛于真实值。相关系数的估计值随删失比例(0%到90%,间隔为10%)与总体相关系数(0到0.9间隔为0.1)变化,未出现较大偏差,表明了估计结果的准确性与一致性。通过重复研究中MLE与替换法和删除法的对比结果可以看出,MLE的估计值方差相对于真实值的偏差较小,明显优于替换法和删除法,有较强的精确性和稳定性。基于shiny为模型图形化提供人机交互的界面,使模型的应用更具有自明性,数据的使用更加灵活,功能模块更具条理,输出的结果更加清晰,大大增加了模型的可用性,提升了统计工作的效率。研究中提出的最大似然法可以简捷有效地对土壤、水中左删失数据的参数及相关系数进行相对无偏的估计,但其对单维统计量的估计有较强的依赖性,仍有一定的优化空间。在此基础上构造的图形化界面为模型的使用提供了方便,为农业环境中左删失数据的参数问题提供了参考。
其他文献
IPCC第六次评估报告指出,在全球变暖的背景下,极端温度和干旱事件的频率和/或强度显著增加,高温干旱复合事件发生的可能性也增加。目前,已经有诸多学者对独立发生的高温事件和干旱事件进行了大量研究,但对于高温干旱复合事件的研究尚且不足,尤其是其机理方面的研究十分不足。深入认识高温干旱复合事件的物理过程和发生机理,有助于未来对该类事件进行归因、预估,提高防灾减灾能力和水平。本研究基于ERA5、CRA_L
基于1958/1959~2017/2018年冬季JRA-55、NCEP、ERA5三种再分析资料,在扣除线性趋势的前提下,采用EOF、REOF与相关回归等方法,揭示出影响东亚冬季气温主要模态的大气遥相关型,并对这些遥相关型的年代际变化特征及影响进行了分析。结果表明:在年际时间尺度上,与东亚冬季气温第一主成分(PC1)最相关的是斯堪的纳维亚遥相关型(SCA),与东亚冬季气温第二主成分(PC2)最相关的
近十几年来,全球野火频发,其中亚马逊地区是火灾季节长度、燃烧面积增加最为显著的区域。野火会排放大量气溶胶,但气溶胶效应仍具有很大的不确定性。本文利用全球生物质燃烧排放数据(GFED)、NCEP/NCAR再分析数据集、哈德莱中心海温资料,利用统计诊断,分析了亚马逊地区野火气溶胶气候效应,并用CESM数值模式探究了不同厄尔尼诺-南方涛动(El Ni(?)o-Southern Oscillation,E
大气边界层的逆温和逆湿结构是北极气候系统的重要特征,与地表和低层大气之间的水分和热量交换以及长波辐射和云的形成都有着密切的联系。本文使用3个北极站的高分辨率探空数据(Global Climate Observing System Reference Upper-Air Network,GRUAN)、45个站点的常规探空数据(Integrated Global Radiosonde Archive,
往返平飘式探空是我国自主研发的一种新型的探测技术,它在上升和下降阶段可以获得高垂直分辨率的大气廓线,在平飘阶段可以长距离探测平流层的大气信息。目前,该探空技术已经完成了多次外场试验,并获得了大量有价值的大气探测资料。本文利用全球导航系统掩星资料和ERA-Interim再分析资料对该资料进行了质量评估,并利用CMA_MESO_3km高分辨率模式3DVar同化系统进行了同化试验。我们探讨了该资料的优势
水库调度是管理水资源的重要手段,有利于防洪、抗旱和水电能源开发。径流预报能够为水库调度提供未来的径流信息,具有重要的指示作用。然而,大部分陆面水文模型难以细致刻画水库调度对河流流量的动态影响,限制了水文气象集合预报在梯级水库流域的应用。另一方面,机器学习方法可以基于数据建模,近年来被广泛用于径流模拟,但其预见期有限,需要与物理模型有机结合。鉴于此,本论文利用气象集合预报驱动陆面水文模型进行流量模拟
青藏高原(简称高原)低涡是在高原复杂地形、动力、热力作用以及大气环流的共同影响下形成的中尺度天气系统。高原低涡不仅是夏季高原地区主要的降水系统,在有利的环流背景下还能够增强并移出高原,引发高原下游地区的暴雨和强对流等灾害性天气。2013年7月19日至21日的一次高原低涡过程生命史较长,在高原上的活动时间长达56 h,并引发高原上的明显降水。低涡移出高原后向东北方向移动,维持时间近20 h,造成了西
地表臭氧(O3)浓度持续升高,已成为全球作物生产和食品安全的主要威胁。小麦作为我国主要粮食作物,较其它农作物对O3更敏感。Ethylenediurea(EDU),中文名称为乙二脲,是现阶段缓解臭氧胁迫的一个主要的有效化学物质,但是其作用机制还未阐明清楚。植物相关微生物组在植物适应各种生物胁迫、非生物胁迫、维持植物健康等方面有着不容忽视的作用。本研究在O3污染严重的长三角地区,依托课题组构建的O3熏
青海省地处青藏高原东北部,是我国太阳辐射资源最大,大气气溶胶污染最轻的区域之一,大气气溶胶对太阳辐射存在一定影响,进而影响到农作物光合作用过程。目前关于大气气溶胶对农作物影响的研究多集中在我国中东部粮食产区,但此类研究区域也受大气气溶胶污染严重,无法全面评价大气气溶胶对农田生态系统的影响。本研究基于多元遥感数据,设计了青海省主要农作物产区的识别和提取方法,提取了2003-2017年青海省主要农作物
陆面模式BCC_AVIM是国家气候中心研发的大气-植被相互作用模式,在设计时通常对植被进行简化,模拟的结果可以满足基本需求,但也导致了部分地区模拟的不足。东北、华北,都是我国主要的粮食产区,其特殊的农业下垫面使该地区陆气之间物质和能量交换与其他地区存在巨大差异,对陆面模式模拟结果有较大的影响。目前BCC_AVIM缺乏对植被功能类型中作物的细分,下垫面数据也较为陈旧,影响到了在典型农区的输出结果,尤