论文部分内容阅读
大数据时代随着数据的爆发式的增长,在带来可供研究的海量数据的同时,同时带来巨量的噪声和垃圾数据.在地学领域,由于研究方向和技术方法手段的众多,产生了数量巨大、多元的地学数据集合.在地学信息的研究过程中,经常能碰到地学信息孤岛、分图幅地学数据在边界附近存在系统误差以及地学文档的非结构化问题.在对地学数据进行信息的提取和挖掘之前,有必要根据研究目的对地学大数据进行预处理清理,使冗余、复杂的大数据转为结构化、准确、稳健、可用的"Smart"数据. 本文以地学大数据向地学“smart,数据的提取转化,以及地学多学科的知识交互与知识发现为主线,介绍在信息时代如何将开发数据(Open data)和链接数据(Linked data)的逻辑思维引入到地学大数据的应用中。首先,以地学大数据的预处理为切入点,从地学数据交互标准与语义网、数据调平、地质图接边和文本结构化四个研究方向阐述目前地学大数据利用方面存在的问题及主要的解决手段。然后,以北美的区域地质年代、古生物信息为例,详细介绍地学多学科数据“Smart”傲据的提取与多学科数据知识发现。