电信统计分析平台ETL工具的设计与实现

被引量 : 9次 | 上传用户:shiqingfang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
增值电信服务已经成为电信运营商的重要收入来源。在当前一切以用户需求为驱动的市场环境下,分析用户需求,把握用户特点是开发新业务的重点,电信统计分析平台应此需求而生。彩铃统计平台(CSP,Colorful Ringback Tone Statistic Platform)是独立于彩铃业务的统计平台。它采集彩铃业务的运行数据,对用户特征进行深度挖掘,为运营商提供运营策略依据。业务分析平台(SAP,Service Analysis Platform)采集智能网(IN,Intelligent Network)业务运行数据,对业务运行状况进行全面的分析和评价,为智能网运维人员提供自动化辅助工具。SAP和CSP都是典型的电信统计分析平台,其核心是格式多样,数量巨大的数据。为了将这些数据集成到统计分析系统中,需要专用的工具来完成这一任务,这就是ETL(Data Extract,Data Transform,Data Load,数据抽取,数据转换,数据加载)工具。ETL工具从不同环境和应用中抽取数据,对数据进行清洗和转化,形成清洁和统一的数据,最终加载到目标数据库中。在此基础上,上层业务才能进行有效的统计分析工作。电信统计分析平台对于ETL过程具有若干特殊要求——数据类型繁多、数据量巨大、需要控制采集端的性能、ETL应该对频繁变化的元数据进行自适应、应当具备采集实时数据的能力。这些特性在CSP和SAP系统中有突出表现。为了满足这些特殊需求,需要进行深入的需求分析,才能给出相应的解决思路。在需求分析和系统的设计实现过程中,可以积累大量实践经验,进而总结出电信统计分析平台ETL工具的若干特点,及其设计指导原则。将这些经验和设计原则总结起来,就形成了一个适用于电信统计分析平台ETL工具的通用框架。这个框架结构灵活,效率理想。不但可以满足已有需求,同时也具有良好的扩展性,可以与电信统计分析平台一起演进,形成新一代ETL工具。本文围绕电信统计分析平台ETL工具的设计展开论述:首先描述了CSP和SAP这两个应用了ETL技术的系统,然后对相关背景知识——数据仓库和联机分析处理(OLAP,Online Analysis Process),进行了简单介绍。第二章分析了ETL建设过程中需要应对的关键需求,并针对各个需求提出了相应解决思路。在此基础上,总结出了电信统计分析平台ETL工具的若干特点,指出了电信统计分析平台通用ETL框架应当具备的基本特征。第三章,根据第二章的结论,设计并实现了电信统计分析平台通用ETL框架:首先简要介绍了ETL框架的各个组成模块,说明了各模块之间的关系;然后对每个模块的设计实现进行了详细的描述。电信统计分析平台通用ETL框架,是本文的核心创新点。最后一章,分析了电信统计分析平台的发展方向,以及通用ETL框架在电信统计分析平台中的应用前景。
其他文献
LOX-1在2型糖尿病大鼠血管病变中的表达及普罗布考的干预作用目的:凝集素样氧化型低密度脂蛋白受体-1(LOX-1)是血管内皮细胞表面氧化型低密度脂蛋白(ox-LDL)的主要受体,通过增
中频炉负荷的强非线性会产生谐波污染电网,并导致功率因数偏低。本文针对含有中频炉负荷的电力用户出现的谐波污染与无功缺乏问题,利用电抗器与电容器的谐振特性进行谐波治理
本文以《草叶集》和《青草灯盏》两部诗集中的多首诗歌为对比文本,通过探索草意象所蕴含的"跃动的生命本体"和"顽强的生命意志",旨在论证阿古拉泰的创作曾受到惠特曼的启发和
目前,我国政府会计采取的是一种预算会计模式,它是国家财政预算管理的有机组成部分,是实现国家财政职能、执行国家预算的重要手段。预算会计是核算、反映和监督政府及行政事业单
视觉文化是一个极具生命力的跨学科研究领域,国外对此已有较为成熟的理论支撑。国内对于视觉文化及其相关课题的研究起步不久,却已具备相当的规模。然而很少有人将视觉文化同儿
针对新船建造完成后进行全速倒车停船试验时,容易发生主机熄火的问题,为避免导致齿轮箱损坏,通过对主机遥控系统逻辑指令执行过程的分析,查找出导致主机熄火的主要原因,提出几种避
象山先生十分关注教化对人格塑造和社会安定的实践意义。与其心学旨趣相仿,象山更为强调的是教化的主体性。象山把教化的本质规定为自我教化,认为教化的关键就在于“正人心”,恢
近年来,国家投入水利建设的资金大幅增加,水利基础设施水平不断提升。但是,水利建设项目繁多,资金需求量较大,与目前水利建设投资水平相比缺口仍然巨大。临泽县在红山湾水库
随着电信体制改革的深化和加入WTO,我国移动通信运营业的竞争也日趋激烈。与其他行业相比,移动通信运营业拥有更多有关用户的数据。谁能正确地挖掘与分析隐含于这些数据中的知