论文部分内容阅读
随着人类文明的不断发展、科学技术的突飞猛进以及对大自然认识的日益深入,人类对地球表面下的空间产生了愈来愈急迫与深入的探知需求。探地雷达(Ground PenetratingRadar, GPR),是近几年发展起来的具备最大潜力的浅地表层遥感技术,它具有速度快、低损耗、分辨率高的突出优点。探地雷达采集的资料记录包含有丰富的地质信息,使得探地雷达资料的处理和解释变成了矿藏勘查、地质勘探等领域中一项很重要的工作。为了获得更多详尽有效的地层信息,发现和开采更多的资源,就需要寻找快速而有效的方法以提取探地雷达信号中的有效信息,挖掘和解释其代表的现实意义。时间序列挖掘作为数据挖掘领域的重要分支,是近几年被广泛研究的内容,目前常被应用于经济、科学、工程、医疗等多种领域。区别于往常研究的静态数据,时间序列数据是一种繁杂的数据结构,它描绘数据随时间演变的经过,并且时序数据是无处不在的。在地学研究领域中,探地雷达探测的数据可以看作是一组与时间相关的数据,将时间序列挖掘用于探地雷达资料处理,可以实现对探地雷达时间序列数据的多模式研究,有效追踪有效波,增强弱信号的识别效果,从而获得更好的地质构造解释。探地雷达数据作为时间序列信号的集合,其数据形式复杂,常伴有各种各样的变形,而且它的变形时间以及变形程度都难以事先预测;传统的数据处理方法是对数据进行时频分析变换,并对衰减信号进行自动增益处理,但是这些方法参数的选择受主观因素影响很大,影响数据解释的效率和可信度。同时,由于探测目标构造的不确定性,探地雷达数据分类数目的确定也存在很大的盲目性,对最后聚类结果的可视化呈现有很大影响。针对上述问题,本文基于时间序列数据的挖掘,对探地雷达数据进行了分析研究,并提出了基于时间序列挖掘的探地雷达数据聚类算法。基于时间序列挖掘的探地雷达数据聚类方法,能够实现对衰减信号的有效追踪,并进一步挖掘潜在信息,提高聚类结果的分辨度。该算法第一步对探地雷达信号进行时间特性分析,选择雷达数据的时间序列特征;然后,针对提出的时间序列特征,选取合理有效的相似性度量方法对探地雷达数据的时间序列特征进行聚类分析,最终形成探测地质的可视化剖面图。其次,针对探地雷达数据分类数目问题,提出一种基于阈值的探地雷达时间序列数据的聚类优化算法;该算法对探地雷达时序特征数据集实行二次分类处理,减小了初始聚类中心定义的主观性,实现了探地雷达数据分类数目的自上而下自适应优化,并能够在较少分类数目下反映更多的数据信息。