云计算环境下GML时空数据聚类挖掘研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:doublexiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
GML的时空数据中隐含着许多的知识信息,这些隐含着的模式与特征,数据与数据之间的关系及其特征等等,通过挖掘这些知识让人们增加对自然界的了解,获取自然界事物的联系、规律和相互间的作用,为人类的生产和生活起积极的指导和决策作用。然而,由于GML时空数据的时间、空间以及半结构化特性,导致无法使用精确的模式来定义GML时空数据,而使得从GML时空数据中进行信息提取比从传统数据中挖掘信息复杂得多。同时,GML时空数据量繁多和计算密集型的特点,使得进行数据挖掘时对计算机的硬件要求一定程度上制约着信息化处理的进程。为此本文在搭建的云计算环境Hadoop平台下,提出了两种GML时空的并行聚类挖掘算法,并且设计和实现了并行GML时空的聚类挖掘原型系统,将聚类结果以地图的形式可视化的呈现出来。在分布式并行计算环境下,可以在很大程度上提高海量时空数据挖掘时遇到的瓶颈问题,即效率问题。具体如下:(1)提出两种针对GML时空序列数据挖掘的并行聚类算法,第一种是提出了结合K-means基于时间序列的GML时空相似度度量,把空间属性和时间序列一同考虑来度量空间对象的时间序列相似度,通过并行的K-means聚类算法来进行数据挖掘。(2)第二种是根据空间邻域的定义,先确定GML时空对象的空间邻域,再在该邻域内计算两具有时间序列属性的时空对象的基于时间序列的相似度,结合并行的DBSCAN (STN_PDBSCAN)聚类算法进行时空数据的挖掘。(3)通过搭建Hadoop云计算的平台,采用MapReduce的编程模型将K-means和DBSCAN两种聚类算法进行并行实现。设计实现并行GML时空聚类挖掘的原型系统,并在该系统上应用实际的具有时间序列属性的GML气象数据,通过实验验证了两种并行算法聚类质量的有效性、算法的高效性能以及算法良好的可扩展性能。(4)最后,将聚类所得的结果以地图的形式可视化的呈现出来。
其他文献
高光谱数据多波段、近连续的特点,使其可以通过拟合地物的光谱特征曲线结合地物光谱特征对地物进行分析,同时高光谱数据具有较高的时间分辨率,也使得其在实时动态监测中的应用具有突出的优势。随着遥感技术的不断发展,获取的遥感数据光谱分辨率、时间分辨率不断提高,利用高光谱数据进行地物分析的研究,在各领域中得到了广泛应用。其中利用遥感技术进行作物旱情时空动态监测是多光谱遥感在农业领域的研究热点之一。山东省济南市
本研究以社会性网络服务社区(SNS)为研究对象,以开心网群组人际节点空间关系为切入点,通过跟踪统计,获取开心网12个代表群组6000个群成员和36个话题的7000左右好友的基本信息
文人画发展到元朝一下成为画坛的独秀,并不是凭空出现的,更不是随意而为之的,勃兴的原因与社会各方面相辅相成,共同作用升华而成。其中元代画家的生存环境给画家画风的转变奠
学位
随着高校学生就业压力的逐年增大,对学生创新能力的培养也提出更高的要求。以高校视觉传达设计专业为例,本身具有明显的专业性、实践性特点,若学生不具备较强的创新能力,将在
随着经济的发展、城市化水平的提高,生产要素资源、资金、劳动力、技术等在产业内部的流动和生产要素的空间聚集,引起城市规模、功能的改变,从而使得整个区域出现新的特征和功能
【摘要】马口窑是湖北重要的民间制陶窑口,素以生产具有实用性和日用性的民艺器具见长,装饰纹样颇具民俗气息。本文围绕马口窑“状元打马游街”系列纹饰展开,以民艺保护与传承、工艺美学研究等视角从纹饰的题材内涵、来源、类别、式样特征和在当代陶艺中的表现等方面深入研究。通过研究,对该纹饰的式样特征和文化内涵进行了梳理,展现了其独特的艺术魅力。本研究内容对马口窑的传承、保护和在现当代陶艺中的借鉴与表现具有重要的
从整个连环画创作来说,涉及的方面很多,有塑造人物、配景、道具、构思、构图、形式、描绘技巧等。这些方面分别来说都是很重要的,哪一方面差了都会影响到作品的质量。但从创
随着网络技术和地理信息系统的快速发展,政府对城市地址地名数据库的建设不断加强,数据库系统的建设已成为数字城市建设和发展的一项重要内容。本文所研究的地址地名数据库管理
煤矿井下大面积停电后,由于没有记录和告警信息,往往很难判断故障原因和故障部位,只有通过试送电进行供电恢复和故障查找,当试送电到故障线路后,又一次造成大面积停电,这时才