逻辑回归空间加权技术及其在矿产资源信息综合中的应用

来源 :中国地质大学 | 被引量 : 0次 | 上传用户:linkageldap
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
综合地质、地球化学、地球物理以及遥感等多方数据是提高成矿预测的精度重要途径。自国际地球科学联合会1978年推荐6种矿产资源评价与预测方法以来,各种信息综合方法被引入成矿预测。由于成矿预测是对矿床是否发生这一二值事件进行的预测,以后验概率为计算结果的log-linear模型被广泛应用于矿产资源预测与评价领域。目前证据权和逻辑回归是矿产资源评价与预测中最常见的信息综合定量方法。与传统统计预测不同的是,成矿预测属于空间统计预测范畴,表现在成矿预测要素和成矿事件具有空间位置属性。矿产资源定量预测和评价很早就开始基于GIS平台进行,并且一些预测要素的构建是通过空间叠加分析、缓冲区分析等得到的。然而,一些更加复杂形式的空间关系并未在预测模型中得到有效表达,如空间变量的集聚性和趋势性。地质过程的复杂性和成矿作用的多期次性使得成矿预测要素的空间分布呈结构性、非平稳性和奇异性,基于经典统计方法建立的成矿信息提取和综合模型往往存在偏差。加拿大地质调查局Agterberg教授于上个世纪60年代末至70年代初就注意到矿产资源预测中些地质变量具有空间趋势,并会造成预测结果存在系统误差,对此他提出在预测模型中引入位置变量以构建不同阶的空间趋势。我国学者成秋明教授则关注到矿点分布具有空间集聚性,这种集聚性具有分形分布特点,为此提出了分形证据权模型。近年来,地理加权回归模型在经济地理学领域兴起。该模型采用基于邻近样点建立的模型对当前点进行预测,且邻近程度被转化为样点在预测模型中的权重。这实际上是一种融合了地理学第一定律的空间变系数模型。由于采用了局部窗口的思想,地理加权回归模型有效克改善了全局模型不能很好克服空间非平稳性的缺点。相比于地理加权线性回归模型,地理加权逻辑回归模型在矿产资源定量预测预评价领域还鲜有报道。如前所述,成矿预测的研究对象属于二值事件,log-linear模型显然更适用。因此本文将在成矿预测中引入地理加权逻辑回归模型。广义来说,地理加权属于空间加权的一种形式,后者还包括基于感兴趣目标的加权,以及基于研究程度的加权等。由于在成矿预测中存在着研究区勘查程度的差异,在建立预测模型时对研究区笼统对待是不科学的。本研究将考虑区域研究程度差异,并量化为空间权重。因此,本研究所指空间加权技术实际上包含了局部窗口权重和全局权重两部分,前者通过地理权重体现,后者则表现在研究区勘探程度或感兴趣目标等差异。缺失数据是包括成矿预测在内所有空间评价与预测领域常见的一个问题,缺失数据的常见处理方法有三种,一是去除含有缺失数据的样本,二是去除含有缺失数据的变量,三是用变量均值代替缺失值。证据权模型提供了另外一种解决方案,它用正负权重代替原始的1和0值,并用0权重代替缺失值。相比于去除含有缺失值的样本或变量,平均值方案和证据权方案显然避免了不必要的信息丢失;而前人研究表明,证据权缺失数据处理方案优于平均值。此外,证据权模型还包含了一套连续变量二值化(离散化)方案,在成矿预测中被广泛采用。本研究所开发的空间加权逻辑回归模块采用了证据权模型中缺失数据处理和离散变量二值化的做法。条件独立性是成矿预测证据权模型的基本假设前提。如果不满足这一假设,不仅会造成后验概率估计值的绝对偏差,也会造成后验概率排序的差异,进而影响远景靶区圈定。逻辑回归模型则无需条件独立性假设,它需要满足相对宽松的假设。本研究所发展的空间加权逻辑回归模型实际上融合了证据权和逻辑回归两种模型的上述优点,并且赋予其空间加权模型的特点。本研究的具体内容为:(1)成矿预测中常用log-linear模型各自优缺点及相互关系研究朴素贝叶斯模型是证据权模型和逻辑回归模型等log-linear模型的基础模型,这三种模型有各自不同的基本假设和适用条件。一些文献将证据权模型与朴素贝叶斯模型的基本假设等同是错误的,它们忽略了证据权模型对于条件独立性的进一步放宽,实际上证据权模型需要满足的是一种弱条件独立性假设。尽管如此,想要满足证据权模型的基本假设仍然有一定困难。而逻辑回归模型所需基本假设进一步放宽。由于采用极大似然法对后验概率进行估计,即使在不满足条件独立性假设或弱条件独立性假设的条件下,逻辑回归也总能得到预测矿点数与实际矿点数相等的结果。证据权模型具有形式简单和易于操作等优点,并且提供了缺失数据处理和数据离散化(二值化)功能,其最大缺点就是需要满足(弱)条件独立性假设,因此一些学者希望借鉴其它模型对其进行改进,这其中就包括借鉴逻辑回归对证据权模型进行改进的研究。Deng(2009)的改进模型可以在一定程度削不满足弱条件独立性假设对预测模型的影响,但是该改进模型存在数学推导错误.Agterberg(2011)的改进模型真正融合了证据权与逻辑回归这两种模型,该模型实际上既包含基于逻辑回归模型对证据权模型的改进,也包含基于证据权模型对逻辑回归模型的改进,两者结果完全等价。在没有缺失数据存在的情况下,Agterberg (2011)的改进模型与一般逻辑回归模型等价;当存在缺失数据时,该改进模型优于一般的逻辑回归模型。而透过该改进模型还可以建立证据权模型与逻辑回归模型之间的关系,本研究将采用这种融入证据权和逻辑回归两种模型特点的改进模型,并与空间加权技术结合,成为新的空间加权逻辑回归模型。(2)空间加权技术与成矿信息综合详细论述了空间非平稳性对于成矿信息提取、综合预测和覆盖区找矿的影响,论证成矿预测中采用空间加权技术的理论依据和现实意义。回顾了前人对空间非平稳性的研究,以及对空间变量趋势性、结构性和奇异性特点所采取的应对措施,讨论了现有空间加权技术的形式和特点,包括地理加权和感兴趣目标加权等。由于成矿预测中使用的变量具有空间非平稳性,需要考虑空间趋势对于预测结果的影响;由于成矿预测区存在勘察程度的差异,需要考虑样本之间的差异性。因此,引入空间加权技术是十分必要。最后讨论了空间加权的具体形式。(3)逻辑回归空间加权技术实现和软件模块开发首先在数学层面讨论了空间加权逻辑回归技术的实现,包括地理权重的计算、研究程度权重的计算以及两种权重的综合。接着叙述了空间加权逻辑回归模型的功能设计过程,包括变量数据二值化(离散化)的实现、缺失数据的处理方案,同时提供了基于地质统计学变差函数模型确定局部窗口大小、形状和权重衰减形式的方案,以及基于空间t统计量的带宽优化方案。最后介绍了具体的算法设计和实现,包括局部窗口参数的设计和模板的构建,以及该模块实现的整体流程。(4)实例研究和对比研究以加拿大新斯科舍省西南Rossignol湖周围地区浊积岩型金矿成矿预测为例,详细阐述了逻辑回归空间加权技术在矿产资源信息综合中的应用。同时基于空间t统计量和预测效率比较了空间加权逻辑回归模型与证据权模型、逻辑回归模型在成矿预测中的表现。此外在人为构建了缺失数据环境下,比较了这些模型的预测效果。结果显示,空间加权逻辑回归模型在本案例中的表现全面优于基于全局数据建立的证据权模型和逻辑回归模型。论文的主要创新点如下:(1)使用GIS空间加权技术对加权逻辑回归模型进行扩展,以更好处理空间非平稳和各向异性环境下的矿产资源信息综合预测。所使用的空间加权技术包含了地理加权和其它形式加权,如研究区勘察程度。(2)探索空间各向异性加权方案,并以地质统计学空间变异函数模型确定地理加权模型中的带宽和衰减权重。(3)该模型还融合了证据权模型对于缺失数据处理和变量图层二值化(离散化)的功能。
其他文献
<正>安美特(中国)化学有限公司是道达尔(TOTAL)石油化工集团的下属公司,总部设在德国柏林,是全球首屈一指为通用五金电镀(General Metal Finishing)提供技术及服务、为印刷电
期刊
滑坡的稳定性评价与预测是滑坡防治的核心内容和前提条件,也是滑坡研究领域的热点和难点问题。自斋藤模型提出以来,众多学者对滑坡的稳定性评价与预测研究取得了丰硕的成果和
2008年5月12日,四川省汶川发生了8.0级特大地震,这是新中国成立以来破坏性最强、波及范围最广、诱发地质灾害最严重的一次强烈地震。此次地震震撼了整个中国,引起了全世界的
<正>为更好地服务于广大读者、作者、客户,《电镀与涂饰》杂志网站现已改版。改版后的网站增添了&#39;信息资讯&#39;、&#39;网络杂志&#39;、&#39;企业风采&#39;和&#39;编辑信
期刊
<正> 铁路与公路相交处设有道口,长期以来,道口事故频出,尤其是无人看守道口接二连三地发生车辆相撞、人员伤亡大事故,因此,人们将道口称为“虎口”。“虎口”名不虚传,自有
期刊
现今,英语已与我们的生活息息相关,其重要性不言而喻。可是现在中学学生的英语学习状况是:初中义务教育阶段两极分化严重。因此,关注后进生的英语学习就显得格外重要与紧迫。“后