Web空间环境数据采集服务系统的架构研究

来源 :中国科学院大学 | 被引量 : 3次 | 上传用户:gunnie0095
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间环境及其扰动不仅影响卫星、通讯系统、导航系统的正常运行,而且在载人航天工作中扮演着重要角色。预报空间环境的变化,已经成为人类进行航天活动的前提基础。空间环境预报需要从赤道到极区的全球观测数据,这不仅需要接收地基台站的连续观测数据,而且需要在空间不同区域进行的空间直接探测数据。既需要实时数据也需要历史数据。而web作为一个浩瀚的海量信息源,也是空间环境预报的重要数据来源。web信息源具有显著的分布性、异构性、动态性和开放性。其数据采集需要从指定网站抓取所需的非结构化信息数据,分析处理后存储为统一格式的本地数据文件或直接存入本地数据库,最终形成统一的领域数据资源。web空间环境数据来源复杂,归类困难。若采用手动复制粘贴的方式,不但费时费力,而且数据的准确率低,完整度差,一致性弱,所以建立一套自动化运行、业务化采集的空间环境数据采集服务系统(Space Environment Data Gather Service System,简称SEDGSS)有助于我国空间环境预报的研究与发展。本文首先探讨传统的web信息抽取系统应用于web空间环境数据采集的局限性,然后提出了一个基于Petri网的信牌驱动式web数据采集模型,最后将其应用于空间环境数据采集服务系统架构的设计与实现中。本文取得的研究成果主要包括:(一)针对数据源复杂、实时性强、准确性高和数据类型多样的web空间环境数据采集任务,提出了一个基于Petri网的信牌驱动式web数据采集模型。(二)利用基于Petri网的信牌驱动式web数据采集模型,采用自顶向下、模块化的设计原则对空间环境数据采集服务系统的架构进行了应用研究,并详细设计为数据源配置子系统、任务控制子系统和任务处理子系统。(三)根据空间环境数据采集服务系统的架构设计,对各个子系统进行了集成研究。对多类型空间环境数据任务的采集工作进行了调度优化,提出了一个混合优先级的多类型空间环境数据采集任务调度算法。
其他文献
近年来,POJ系统逐渐应用于编程课程中,与教学结合得越来越紧密。我们发现仅靠反馈给学生评测结果是远远不够的。用户程序被判定为出错或超时后,往往希望系统能够给出错误原因
三维动态流场可视化是反映真实环境动态变化的可视化技术。采用粒子系统进行的可视化,使用大量具有一定属性的简单图元来表达不定形的物体或者微粒集合,具有绘制效率高,资源消耗
随着互联网的不断发展,XML在数据库领域发挥着越来越重要的作用。当前对XML数据的查询需求也不断增强,为此,W3C提出了XQuery语言,作为XML查询语言标准。XQuery和XML数据的关系类
系统芯片为移动设备提供了低成本、小尺寸、高性能、低功耗的解决方案,近年来得到了快速发展。随着工艺水平的提高和芯片设计规模的增大,系统芯片功耗管理为芯片开发带来了挑战
在航天任务中空间柔性展开机构广泛用于探测载荷、通信天线和太阳能帆板等的支撑结构。在飞行器轨道中,携带柔性展开机构的飞行器处于真空和微重力环境下,受飞行器平台动作影
近年来,随着传感器技术、嵌入式技术和无线通信技术的不断发展,无线传感器网络成为在国际上备受关注的前沿热点领域。它在工业、农业、军事、科研等领域均有广阔的应用前景。Zi
路径规划问题(Routing Planning Problems,RPP)在航线设计、管道铺设和改善城市交通等现实应用中有着十分重要的作用。根据不同的限制条件和求解要求,RPP问题又可以细分为最优路
随着信息科技的发展和应用的普及,以及政务信息和商务信息迅猛发展,分布式技术得到了快速的发展。在诸多分布式技术中,CORBA作为跨平台跨语言的分布式技术得到了很好的发展。COR
L2Cache(Level-2Cache,二级高速缓存)是计算机体系结构中连接L1Cache(Level-1Cache,一级高速缓存)和主存的缓存单元,负责实现L1Cache与主存的数据缓存及传输功能,是计算机系统的
自万维网(WWW)诞生以来,各种信息不断在网络上涌现,网络用户数量也与日俱增。近些年,网络内容组织方式也在逐渐地发生变化,从“博客”到Facebook,再到Twitter,互联网上出现了