【摘 要】
:
企业的信息资源具有分布式和异构性等特点,随着通用数据访问提供多源、异构数据源的统一访问方式,用户通过统一访问接口可以访问数据源中的数据,继而通过可视化建模工具对数
论文部分内容阅读
企业的信息资源具有分布式和异构性等特点,随着通用数据访问提供多源、异构数据源的统一访问方式,用户通过统一访问接口可以访问数据源中的数据,继而通过可视化建模工具对数据源进行映射操作,建立汇聚的流程、,最终生成满足需求的数据。现有的异构数据汇聚由工程师通过可视化建模工具手工定义模式映射,这是一项繁杂、耗时且容易出错的工作。面对这种问题,本文以“XBus数据汇聚平台”为依托,针对数据汇聚模式和优化问题做出了研究,主要贡献如下:首先,提出了一种基于映射操作的流程建模方式。提出了基于模式映射的映射操作的概念,给出了一系列映射操作的定义以及实现来扩展模式映射的语义。用户通过映射操作,可以自动保持源文档和目标文档之间的语义联系,而不必明确各个操作的具体语义,减少了汇聚中的错误。提出了一种数据汇聚流程的构建方式,并且给出了对应的数据模型和算法。其次,提出了一种数据汇聚的优化方法。对基于XQuery查询的数据汇聚的执行效率和能力问题进行了分析,给出了一种基于投影的优化XQuery查询语句的算法,给出了投影路径和投影文档的概念,提供了投影路径分析算法以及路径装载算法。通过对XQuery查询语句进行优化,增强了受内存限制的XQuery执行引擎的执行效率。最后,实现了基于此研究的数据汇聚平台。将上述两个问题的研究成果应用于数据汇聚平台(XBus)中,实现了以映射操作为核心的可视化的流程构建工具,使用投影技术对XQuery解析引擎进行了优化。给出了实验数据与相关产品进行比较,结果表明其易用性良好,具有较高的查询效率。
其他文献
Web服务为企业IT体系结构带来互操作性、灵活性和复用性,改变了商业伙伴之间的合作方式,使企业能通过服务组合来共享资源,自动化商业流程。Web服务组合问题近年来成为研究热
随着嵌入式技术的发展,外部硬件设备的价格逐渐下降,嵌入式系统存储能力迅速提高,应用中出现了越来越复杂的数据资源需要管理。如何有效地管理数据成为嵌入式系统开发中的重
自从20世纪60年代MRP(物料需求计划)在美国出现到现在,以物流技术为主的供应管理系统也日趋成熟。但随着市场竞争的加剧,使得企业也不得不跟随市场的需求变化而变。如何在当
企业服务总线(Enterprise Service Bus, ESB)支持异构环境中的服务、消息以及基于事件的交互。Web服务客户端为企业服务总线中集成的服务调用提供了一种能力。然而,现有的Web
传统的计算机体系结构中,运算单元一般可以分为两类:一类是通用处理单元,该类运算单元依循特定指令集,通过软件编程方式进行运算,其特点是通用性强但性能不高;第二类是采用ASIC
遗传算法是一种基于概率导向的随机搜索算法,已被成功地应用到多种学习任务和最优化问题中。对于遗传算法,策略(包括算法流程、算子及其控制参数)的设计和选择至关重要,会对
随着语义Web技术的标准化,关联数据在各领域得到广泛推广和应用,使得关联数据的发布达到空前规模,这导致了关联数据的存储和传输难度增大。通过压缩技术减小关联数据体积的方
图像的超分辨率重建是指从相同场景的单幅或多幅低分辨率图像中重构出一幅包含更丰富细节的高分辨率图像的技术。这一技术突破了硬件成像系统的限制,经济且有效地提高了图像
当今的大数据应用往往具有一个共同的特点,同样的计算往往在不断变化的数据上重复执行,例如社交网络数据和网页数据。在这些应用中只是少量数据发生改变,如果重新计算则工作
近年来,随着互联网和分布式计算的发展,海量数据处理的性能有了很大提升。在许多应用领域中,都需要从海量数据中提取出增量数据来满足某种业务需求,尤其是对于不断更新的源数