彩铃统计分析平台数据采集与预处理子系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:shizex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
彩铃业务是“个性化多彩回铃音业务”(Color Ring Back Tone)的简称,是一项由被叫用户定制,为主叫用户提供一段悦耳的音乐或一句问候语来替代普通回铃音的业务。近年来,彩铃业务以其新颖、个性化的特点,在国内得到了迅速发展,已经成为电信运营商ARPU(Average Revenue Per User)值的重要贡献力量和新的利润增长点。彩铃用户多为年轻人群,为了满足他们追求时尚和个性的需求,运营商不断推出彩铃新功能和特色服务,并不定期地举办各种营销活动。为了更好地监控业务的运行,发现用户偏好,运营商提出的统计需求越来越多,并需要及时得到统计数据并加以分析。传统上,这些需求的实现需要加载到彩铃业务主机运行。这在一定程度上消耗了彩铃系统的主机资源,影响彩铃系统的正常运行。另一方面,统计分析的结果不够丰富和灵活,及时性、针对性不强,难以满足运营商的要求。彩铃统计分析平台(Color-ring Statistic Platform,CSP)是专为彩铃业务推出的统计分析解决方案。通过把彩铃业务相关数据采集到专有的统计分析主机,然后在此主机上进行数据加工和运算,从而有效地缓解了彩铃系统的运行压力,降低了彩铃业务主机的负荷。同时,该系统充分利用了统计主机的计算能力和存储资源,更有效地进行数据加工,向用户提供专业、详实的统计数据,并通过多种方式展现给用户。彩铃统计分析平台可划分为数据采集层、数据预处理层、数据处理层和数据展现层四个功能层。本文的核心是设计并实现数据采集与预处理子系统,它实现了数据采集层和数据预处理层的功能。数据采集层负责将原始数据从彩铃业务主机批量采集到统计分析主机,加载到数据库中。数据预处理层则根据预先定义的规则,对原始数据进行清洗和格式转换,删除脏数据并保证数据格式的正确性,为上层系统提供可靠的数据保障。本文从彩铃业务的发展现状展开讨论,第一章介绍了彩铃业务的背景,分析了运营商对彩铃统计的需求,并介绍了彩铃统计分析平台的总体结构。第二章详细分析了本文核心的数据采集与预处理子系统的需求,对子系统的实现难点和关键技术特征进行了总结,并对比不同的解决方法,找到了合理的解决方案。第三章在需求分析的基础之上,对子系统的设计与实现进行详细的介绍。首先介绍了子系统的结构和工作流程,并根据功能将子系统划分为数据采集、历史数据管理和数据预处理三大模块。然后对各个模块的详细设计与实现进行了介绍。第四章对数据采集与预处理子系统进行了测试,以验证其满足系统需求。最后一章对彩铃统计分析平台的现状进行了介绍,提出了需要改进和进一步研究的问题,并对彩铃统计分析平台的前景进行了分析和展望。
其他文献
随着计算机技术和网络技术的迅猛发展,计算机系统已经从独立的主机发展到复杂的、互连的开放式系统。这种情况导致计算机及网络的入侵问题越来越突出,为保护系统资源,需要建
光线跟踪是真实感图形绘制的主要方法之一,它能够逼真地模拟各种光照效果。但由于光线跟踪算法需要递归地跟踪每一条从视点发出的光线,涉及到大量的光线与景物的求交计算,故处理
对等计算是未来重构基于Internet应用的关键技术之一。对等计算的核心思想是所有参与系统的节点都拥有对等的功能与责任,可以随时自由地加入或离开该系统,形成一个真正动态的
无线传感器网络是计算机、通信和传感器三项技术相结合的产物,作为一种新的信息获取和处理技术,目前成为计算机科学领域一个活跃的研究分支。传感器网络由大量的传感器节点组成
作为向下一代网络演进的重要手段之一,Overlay网络的发展正受到越来越多网络研究人员的关注。在应用层组织起虚拟的通信结构,用户之间可以通过协作来实现原有网络所不能提供的
当前,电信业务朝着多样化方向发展,普通的呼叫类业务已经不能满足用户的需要,电信业务日益增多,信令流程的复杂度也随之增加。同时,用户对服务质量的要求日益增高,这就要求业
随着电磁场理论的发展和计算机性能的不断提高,计算电磁学在最近几年得到了长足的发展,其中,时域有限差分(FDTD)方法由于其独特的性能和优点得到了越来越广泛的重视和应用。
作为生物医学信息抽取领域的重要分支,蛋白质交互关系抽取(Protein-Protein Interaction (PPI))是构建蛋白质关系网络的前提条件,具有至关重要的研究意义。目前的PPI研究大多
近年来,随着多媒体技术及无线传输技术的发展,基于嵌入式流媒体技术的视频采集传输系统作为远程视频监控、可视电话会议和工业自动控制领域的一项核心关键技术得到了飞速的发展
网格的目标是使得人们能够利用地理上分散于各处的资源,完成各种大规模的、复杂的计算和数据处理任务。资源的有效管理是网格能够提供可靠服务的基础,然而网格资源的动态性、异