分布式天文海量数据处理与控制研究

来源 :中国科学院大学(中国科学院云南天文台) | 被引量 : 12次 | 上传用户:edison_young
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
天文仪器的制造工艺的提高,高分辨率设备的应用,现代的大型望远镜都面临着海量观测数据处理的挑战。我国明安图射电频谱日像仪(Mingant U Sp Ectral Radioheliograph,MUSER)以高空间、高时间、高频率分辨率对太阳活动进行观测,按照每天8小时观测时间计算,每天的原始数据量可达2.6TB,且包含实时计算和批量计算模式。在MUSER海量数据处理的需求背景下,传统的单机多线程、多核并行技术,表现出诸多的局限性。当前一些主流的开源分布式数据处理技术,例如Hadoop,因为依赖特定存储技术,编程接口,数据处理对象和模式等因素限制了它们在天文数据处理中的应用,并不适合在射电数据处理中。因此,MUSER海量数据处理就需要设计和实现一套具有高性能、高扩展性,易编程的分布式数据处理框架。澄江一米红外望远镜(New Vacuum Solar Telescope,NVST)目前已投入观测,由于观测的需要,陆续新增了多个设备,但新增的各类终端设备均是独立工作,导致当前的观测过程严重依赖于人工现场处理,缺少统一的控制与观测调度。因此为发挥NVST的作用,必须进一步提高整体系统的自动化、信息化,把当前分离的各个子系统进行整合,实现望远镜自主观测。因此,本论文以分布式数据处理技术为核心,研究分布式计算框架的设计、分布式计算在MUSER中的具体应用和基于Zero MQ的望远镜观测控制系统的网络通信模型设计,论文主要研究工作包括:1)Spark Streaming实时计算框架在MUSER的准实时的抽样观测数据处理中的应用。针对MUSER的需求,设计了自定义的接收器,选择自定义分区方式,等多种方式优化Spark Streaming在MUSER实时处理中的性能,通过异步执行方式提高处理的稳定性;2)面向天文海量数据处理的分布式计算框架(Open Cluster)的设计。使用在天文中广泛应用的Python语言编写,提供了简易的编程接口,多类型工作节点,方便天文学家将已有数据处理代码简单快速地扩展成分布式应用,节点失效检查使用心跳机制,支持一主多备提高主节点的高可用性,实现了简单的领导者选举机制。将该框架应用在MUSER的实时和批量数据处理中,设计了MUSER数据处理的应用界面;3)多种集群资源调度研究。深入分析了Mesos集群资源管理器,针对设计的分布式计算框架的独立调度模式的不足,结合Mesos实现了单任务单框架和集中仓储式调度模式。解决了集群中多种计算框架的资源隔离和共享,优先级的任务调度问题;4)基于Docker的Caa S(Container as a Service)构建天文轻量级私有云环境。为提高MUSER中长期运行服务的可靠性,使用了Mesos+Marathon+Docker组合进行应用的创建和容器的调度,使用Kubernetes容器管理工具创建可靠的MUSER长期运行服务;5)基于Zero MQ的望远镜观测控制系统的网络通信模型设计。分析了开源天文望远镜控制系统RTS2中基于Socket网络通信的局限性,根据物联网应用中和望远镜控制系统中都是对设备控制的相似性,讨论了物联网通信协议MQTT在望远镜控制系统中适用性,给出了基于Zero MQ的天文望远镜控制中通信部分设计。论文研究的面向海量观测数据的分布式处理技术和基于Docker的轻量级容器云部署应用解决了MUSER观测数据的实时、历史积分数据分布式处理和可靠服务应用的难题,实际应用性较强,基于Zero MQ的望远镜观测控制系统的网络通信模型设计为未来观测控制系统的实现打下了良好基础。研究方法也为未来国内外类似射电望远镜海量数据的分布式处理和望远镜观测控制系统的设计提供了参考,具有一定的应用和推广价值。
其他文献
食品加工工艺对真菌毒素有明显的影响。本文综述了分类和清理、磨粉、贮藏、发酵以及加热处理等加工措施对小麦中真菌毒素的消解及转移的影响。一般的加工工艺只能降低毒素含
传统的网络入侵检测方法准确率低,安全性较差。严重限制了计算机网络的进一步发展与应用。提出基于改进遗传算法的网络入侵检测算法,通过建立遗传计算数据信息向量权值,根据
文章阐述信息化的重要性并分析广西信息化现状,提出广西要实现富民兴桂新跨越必须走信息化带动工业化路子.要加强信息基础设施建设,发展电子信息产业,积极发展信息服务业,加
新的时代需要有效的思想政治工作.面对日趋复杂的新情况、新问题,如何加强和改进思想政治工作,增强其有效性,已愈益成为思想政治工作理论研究必须关注的重大课题.对这一课题
期刊
目前随着高校人数的扩张以及对实验室要求的增大,许多高校都出现了传统的实验室使用紧张的现象,这时,以虚拟仪器技术、传统计算机技术以及计算机网络技术等作为主要的技术支
随着我国特殊教育的发展,特殊教育咨询的需求也日益增加。目前我国特殊教育咨询理论体系尚未完善,特殊教育咨询实践研究较少。基于"焦点解决短期咨询"理论在国外特殊教育咨询
目的观察脑梗死早期应用依达拉奉的疗效。方法将70例患者随机分为依达拉奉治疗组(治疗组)和常规治疗组(对照组)各35例,两组患者均采用综合治疗,均给予阿司匹林、胞二磷胆碱、蕲蛇
我有事路过巴黎,在法国朋友伊莲的陪伴下,逛了一趟塞纳河边的旧书摊。置身于那弥漫着旧书气味的怀旧氛围中,我深刻感受到了法兰西文化的情调。远远望去,在风光绮丽的塞纳河边