论文部分内容阅读
空间环境及其扰动不仅影响卫星、通讯系统、导航系统的正常运行,而且在载人航天工作中扮演着重要角色。预报空间环境的变化,已经成为人类进行航天活动的前提基础。空间环境预报需要从赤道到极区的全球观测数据,这不仅需要接收地基台站的连续观测数据,而且需要在空间不同区域进行的空间直接探测数据。既需要实时数据也需要历史数据。而web作为一个浩瀚的海量信息源,也是空间环境预报的重要数据来源。web信息源具有显著的分布性、异构性、动态性和开放性。其数据采集需要从指定网站抓取所需的非结构化信息数据,分析处理后存储为统一格式的本地数据文件或直接存入本地数据库,最终形成统一的领域数据资源。web空间环境数据来源复杂,归类困难。若采用手动复制粘贴的方式,不但费时费力,而且数据的准确率低,完整度差,一致性弱,所以建立一套自动化运行、业务化采集的空间环境数据采集服务系统(Space Environment Data Gather Service System,简称SEDGSS)有助于我国空间环境预报的研究与发展。本文首先探讨传统的web信息抽取系统应用于web空间环境数据采集的局限性,然后提出了一个基于Petri网的信牌驱动式web数据采集模型,最后将其应用于空间环境数据采集服务系统架构的设计与实现中。本文取得的研究成果主要包括:(一)针对数据源复杂、实时性强、准确性高和数据类型多样的web空间环境数据采集任务,提出了一个基于Petri网的信牌驱动式web数据采集模型。(二)利用基于Petri网的信牌驱动式web数据采集模型,采用自顶向下、模块化的设计原则对空间环境数据采集服务系统的架构进行了应用研究,并详细设计为数据源配置子系统、任务控制子系统和任务处理子系统。(三)根据空间环境数据采集服务系统的架构设计,对各个子系统进行了集成研究。对多类型空间环境数据任务的采集工作进行了调度优化,提出了一个混合优先级的多类型空间环境数据采集任务调度算法。