云环境下异构信息交换模板的研究与设计

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:rechardfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日益海量的信息数据环境下,云计算理论与技术成为处理大规模信息数据的主要手段。云计算的核心思想,是将大量用网络连接的计算资源统一管理和调度,构成一个计算资源池向用户按需服务。国家某部委在这样的云环境背景下,提出了异构信息交换模板的探究设计的课题,本文基于在与其合作课题下完成了如下研究工作:1.在对异构信息交换模板理论研究的基础上,研究与设计了异构信息交换模板系统的数据输入与解析。所谓异构信息交换模板这个概念需要分拆解释,异构顾名思义,就是指整体结构互不相同,信息交换是目标,当异构的文本被标准化成统一的模板时,就能达到数据共享,也就是互相间的信息补充、交换。此模块主要是将多种异构的数据源信息纳入系统并解析成树结构文档对象模型。由于课题输入数据源类别多,数量大,文档对象模型也不同。主要的输入数据为基于HTML的网络页面信息、Adobe pdf文档以及微软的MS-WORD文件,不同数据源采用了不同的解析策略。2.在解析好树状文档对象模型的基础上,研究与设计了如何对数据进行筛滤、提取后,构建起信息交换模板雏形。数据过滤前后,以准确率、召回率、F值等指标进行性能跟踪。在模板构建时,采用工厂模式与单例模式等,面向接口的设计模块功能,保证了更高的可扩展性。3.在模板构建后,根据模板属性,对其进行信息交换模板归类并序列化存储于数据库,根据反馈不断调整参数优化系统。对于模板的归类原则,应用贝叶斯分类器原理来进行归类。在序列化存储时使用JAVA序列化API,结合数据库连接池技术存于数据库中。根据反射机制,不断提高模板构建的准确率、召回率及F值等性能。在课题研究与设计中,在云环境背景下,对异构信息交换模板系统进行了分模块分析,系统设计以及系统实现。根据时间占用度,空间占用度及准确率、查全率、F值等进行了性能评测,系统良好。
其他文献
随着产业技术的进步,用户对通信质量要求逐渐提高,如何有效提升无线通信网络性能、提高用户服务质量一直是业界研究和关注的热点。基于协同分集的无线多跳网络与传统的无线多
第一部分:NMDA对大鼠海马神经干细胞增殖和分化的影响 目的:观测体外培养胎鼠海马神经干细胞NMDA受体亚单位的表达情况,并探讨NMDA对神经干细胞增殖以及分化为神经细胞的作
图像拼接是将两张或两张以上具有重叠视场的图像拼接成一副全景图或高分辨率图像的过程。图像拼接将各图像中互补的信息结合起来,去除了相互之间的冗余信息,得到了目标场景比较
目的:我们以往的研究表明,下丘脑室旁核(paraventricular nucleus,PVN)是调控胃缺血-再灌注损伤(gastric ischemia-reperfusion injury,GI-RI)特异性中枢核团之一。本工作的目
本文针对移动视频业务和传输系统难以完全定量分析、多准则的特点,以机理分析和统计分析为理论基础,对大容量移动视频业务和视频传输系统进行分类和量化,建立层次分析法模型,
弹丸飞行速度是衡量武器系统技术指标的一项重要参数,在靶场测试中常常需要测试弹丸的速度。在靶场测试领域,天幕靶是一种常用的光电触发设备,两台天幕靶与一台测时仪配合就可以
激光雷达是一种先进的主动遥感技术,可快速获取目标的三维信息,目前已经被广泛应用于遥感测量中的很多领域。全波形激光雷达以非常小的采样间隔记录激光发射和后向散射回波脉冲
随着计算机的普及和互联网的发展,数字音乐得到广泛的传播。在浩如烟海的音乐库中如何快速、有效的找到所需要的音乐是一项非常有意义的课题。本文围绕基于样例的音乐检索这
运用高密度寡核苷酸芯片建立大鼠胰腺发育不同阶段(胚胎(E)12.5,E15.5,E18.5,新生和成年)的基因表达谱,经过生物信息学数据分析发现许多与胰腺功能相关的基因在E18.5相对高表达,提
簧管乐器是中国传统民族乐器中不可或缺的一类乐器,而笙则是其中的典型。它历史悠久,在民乐演奏中具有重要地位。与西方簧管乐器相比,关于我国簧管乐器的研究还存在较大空白。传