论文部分内容阅读
在地球化学研究中,日益提高的分析测试水平和不断深入的研究程度,使得地球化学数据的数量和质量急剧提高。华北克拉通作为研究中国东部岩浆活动、构造作用及成矿作用的天然实验室,国内外研究人员开展了大量深入的地球化学研究工作,现已积累了大量高质量的地球化学数据。如何有效地存储、管理、共享从而充分利用(包括多次利用和综合利用)已有地球化学分析数据,特别是华北克拉通地区的已有分析数据,对这些地球化学数据进行快速高效的分析,已成为华北克拉通地质研究中急需解决的基础问题,也是国内外地学工作者共同关心的问题。现有地球化学数据管理方法主要包括传统的数据文件或电子表格方式、数据库方式。其中利用电子表格和数据文件只能管理少量地球化学数据,数据的查询、交流、共享、筛选困难。而已有数据库主要是科研单位为存储特定数据建立的,多数为专题数据库,存在地球化学数据模型不完整、元数据信息缺乏、没有或者只有很弱的数据分析功能、数据库操作复杂等问题,不能满足科研工作的需求。科学数据库是指利用关系数据库技术、网络技术、地理信息技术等相关技术实现对海量科学数据合理、高效的管理、共享和交流,使科研人员能够利用该技术方便的进行科学数据的管理、查询、分析和深入研究。科学数据库为地球化学数据的科学管理提供了新思路,应用科学数据库实现地球化学数据的共享、获取、交流成为国际地球化学科学数据管理领域的前沿热点方向。本文将科学数据库方法引入华北克拉通地区地球化学数据管理研究中,主要目的为以华北克拉通为研究对象,深入研究地球化学数据的结构、组成和特点;建立科学、合理、完善的地球化学数据模型;应用关系数据库技术、GIS和WebGIS技术、网络技术,建立华北克拉通地球化学科学数据统一管理、存储、共享、查询,以及空间可视化、空间分析、专业分析的理论体系和技术路线;研究和建立新的地球化学投图软件,解决已有地球化学专业投图软件难于操作、不易应用、扩展的缺点。进而为解决地球化学数据的科学管理、高效分析这一地球化学学科及其相关领域迫切需要解决的重要问题提供新的思路方法。研究内容主要为:(1)地球化学数据的结构、组成和特点研究。完整的地球化学数据不仅包含基本的岩石样品分析数据,而且包括样品的描述性辅助信息,即元数据信息。通过深入研究地球化学数据本身的内容和特征,同时考虑与国际研究进行信息交流,选择对科研工作必须的数据项及元数据进行存储。具体方法为,参考国际、国内已有数据库标准,如EarthChem,中国及全球火成岩数据库等,并参考已发表大量地球化学数据,选择建立数据模型的数据项和元数据信息。(2)地球化学数据模型研究。目前没有统一的地球化学数据标准,造成了不同文献、报告、出版物之间的数据无法共享、深入研究和重复利用,也造成了已有地球化学科学数据库普遍存在数据模型不完整、不合理,研究者只能查询相关信息,很难进行深入分析研究。本研究在对地球化学数据特征的深入研究、分析基础上,应用关系数据库理论和空间数据库理论建立科学、合理的地球化学数据模型。所有数据被储存在一系列具有唯一名称、相互关联的关系数据表中,这些数据表涵盖了地球化学数据的分析结果、属性信息和元数据。(3)华北克拉通地球化学科学数据库建设。根据上述关系数据模型及地球化学数据所包含的内容,应用关系数据库技术、GIS和WebGIS技术、网络技术,基于Web平台,建立华北克拉通地球化学关系数据库,为地学工作者提供了一个地球化学数据共享、获取、交流的协作工具。同时为了降低数据库录入数据的出错率,将为用户提供Excel表格形式的数据模板,通过程序实现外部数据自动转存至数据库。(4)地球化学数据应用研究。包括GCDPlot和探索性数据分析(EDA)、探索性空间数据分析(ESDA)方法在地球化学数据分析中的应用研究。目前,国际国内已有研究人员将EDA、ESDA技术引入地学研究中,但这方面研究还十分有限,尤其是在地球化学领域。对于地球化学研究来说,EDA、ESDA是一个非常新的研究方法,本文试图将EDA和ESDA方法引入华北克拉通地球化学科学数据库,与GIS和可视化、空间可视化技术结合,实现地球化学数据的实时空间分析、专业分析等功能,使研究人员能够直接探索隐藏在数据中的关系、模式和趋势等,获取数据的基本特征,为进一步深入研究提供基础信息。地球化学投图系统研究的主要内容是基于Excel VBA开发新的地球化学投图软件——GCDPlot,解决已有地球化学专业投图软件难于操作、不易应用、扩展的缺点。通过对以上内容的研究,论文取得了以下成果:(1)设计了完整、高效的地球化学关系数据模型,建立了地球化学关系数据库。通过对地球化学数据组成、特征的分析,参考已有国际、国内地球化学数据库的数据模型,利用关系数据理论和关系模型,设计了科学、合理的地球化学关系数据模型,为地球化学数据库建设提供了完整的、可直接应用的地球化学数据模型。在此基础上,建立了地球化学关系数据库。(2)应用ArcIMS、关系数据库、服务器缓存、Ajax等技术,实现了地球化学科学数据库与GIS技术的无缝集成和融合,解决了地球化学科学数据的在线、实时空间检索、空间可视化和空间分析等问题。具体来讲,首先,在基于Web的地球化学科学数据库中集成ArcIMS,将GIS功能无缝嵌入到地球化学科学数据库中;实现了地球化学数据基于位置的查询检索;查询结果的标注;查询结果的分类专题图和分级专题图;解决了地球化学数据的位置、分布、趋势等空间问题。其次,通过应用服务器缓存和Ajax技术的ArcIMS开发,大大提高了用户体验,降低了基于ArcIMS的WebGIS服务器负荷。(3)将EDA和ESDA技术引入地球化学科学数据应用分析研究中,研究了对地球化学数据应用分析研究有用的EDA、ESDA方法,包括直方图、散点图、箱线图、专题分类图、专题分级图、柱状图及图形与空间属性之间的联动等。EDA、ESDA技术与GIS和可视化、空间可视化技术结合,实现了地球化学数据在线的EDA、ESDA分析。论文中的EDA、ESDA方法为地学、地球化学研究人员提供了新的数据分析方法。(4)建立了国内地球化学领域第一个将基于Web的数据检索、数据可视化和空间可视化、数据分析等功能集于一身的地球化学科学数据库——华北克拉通地球化学科学数据库(NCGD),不仅实现了对中国东部已发表地球化学数据的统一管理、存储、共享、查询,而且具有已有地球化学数据库没有的空间可视化、空间分析、专业分析等功能。为地学工作者提供了一个地球化学数据共享、获取、交流的协作平台,为解决该区地球化学数据科学管理这一急需解决的问题提供了可行方案。对华北克拉通地质、地球化学研究具有重要的实用价值。(5)开发了基于Microsoft Excel VBA的地球化学投图软件——CDPlot。该软件不仅具有基本的地球化学投图功能(包括X-Y散点图、三角图、常用的地球化学图解等),而且可以方便的进行扩展,研究人员可以按照不同的方法自行编辑已有图解、自行添加新的图解。利用GCDPlot绘制的图解为标准的Excel图表,数据输入、输出、处理,图表的修饰、输出、打印都可以直接利用Excel完成。GCDPlot成功解决了已有地球化学专业投图软件难于操作、不易应用、不易扩展的缺点。