论文部分内容阅读
基于多级应用的多数据系统,为满足企业级和平台级的不同数据分析需求,采用分布式环境构建两级数据仓库。利用数据库链接实现跨数据库间的数据交互;采用夜间增量更新的数据驱动策略,控制两级数据仓库更新的数据量且减少了服务期间的通信频率;特别针对逻辑模型完整性进行讨论并给出了设计方案。通过对存储管理层进行功能测试发现,采用上述策略能够成功构建两级数据仓库并正确实现数据集成。进一步对数据集成效率进行分析,发现在数据量较少的情况下采用表分区技术能够减少数据集成的时间开销约达45%。