基于Hadoop的多星表存储与交叉证认的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:l1otus
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学技术的不断发展使天文学进入了全波段巡天时代,同时天文观测得到的各个波段的数据迅速增长。随着我国LAMOST项目开始正式巡天,在巡天过程中将会逐渐发布海量的光谱数据,同时世界各地其他国家的巡天星表数据也不断发布,如WISE(Wide-field Infrared Survey Explorer)、FIRST (Faint Images of the Radio Sky at Twenty-Centimeters)、Pan-STARRS (Panoramic Survey Telescope&Rapid Response System)、SDSS(Sloan Digital Sky Survey)、2MASS (Two Micron All Sky Survey)等。由于不同巡天望远镜性能不同,导致星表中位置的误差半径和包含的波段信息各不相同,所包含的天体物理信息也有一定的差别。为了获得天体更全面、系统的信息,需要对各个波段的天体信息进行交叉证认,获得天体的多个波段的信息,为后期开展统计分析、数据挖掘做准备。面对海量天文数据,如何高效的存储和对多星表进行交叉证认显得尤为重要。海量天文数据处理必须要使用分布式、并行计算等大数据处理技术才能有效解决。本文对利用Hadoop处理海量天文数据进行了研究,主要工作分为以下三部分:1.利用Hadoop的HBase组件,构建对不同星表数据的有效存储,提高集群磁盘利用率和星表信息查询效率。2.在对HEALPix和HTM两种伪二维球面索引方法进行研究的基础上,结合Hadoop实现多个星表之间高效的交叉证认。3.将交叉证认结果存储在Hadoop中,方便用户对交叉证认结果的下载和根据指定信息对要查询结果的下载。本文结合Hadoop实现了对海量天文数据的存储和多星表间的交叉证认,有效的提高了星表数据的存储和交叉证认效率,对今后解决同类海量天文数据的处理应用有重要的参考价值。
其他文献
学位
随着现代装备的多样化和复杂化,传统的纸质技术手册存在的数量膨胀、成本高昂和更新困难等问题日益突出。S1000D作为一个国际技术出版物规范,它的数据重用等特性,能有效支持
直接建模技术作为实体建模技术的最新发展,近年来受到工业界的广泛重视。直接建模的主要特点在于无需关注建模历史,直接在边界表示模型上进行编辑操作,因此它是一种十分方便、高
近些年,云计算的出现对IT界甚至是是人们的日常生活都产生了深远的影响。OpenStack也是最近几年出现的一个开源云计算IaaS平台,受到广泛的接受与好评,涌现出许多基于OpenStack的
文物是我国五千年的辉煌文明历史遗留下来的珍宝,具有重要的历史、艺术与科学价值。然而由于环境与本身内在因素,文物正在逐渐损坏,传统文物的保护工作也无法从根本上保护好文物
舌诊是一种重要的中医诊断方式,由于长期以来是以医生主观判断为主,阻碍了中医的发展,因而实现中医舌诊的客观化,对中医现代化具有重要意义。舌象采集作为舌诊系统的基础部分
图像特征提取与匹配是计算机视觉领域的基础研究问题,也是该领域的研究难题。在过去的数十年内,该问题持续是热点研究问题,国内外很多专家学者相继提出了很多特征提取与匹配
随着信息技术的高速发展,人们的日常生活中涌现了大量的科技产品,而人们对于生活品质的更高追求使得对于科技产品的体验提出了更高要求。Java Card技术自诞生起便凭借其自身
现在主流的CAD建模方法是参数化特征建模,但参数化特征建模技术对复杂模型的编辑效率低下,且来自于操作历史的约束也限制了模型编辑的灵活性。近年来兴起的直接建模技术通过直
目前,大部分企业都将IT基础设施进行集中监控,以便统一管理调度,提升业务应用的性能。针对监控到的海量事件,如何有效地将它们融合在一起加以利用,获取更有价值的信息,是进行