基于Hadoop的无线网络业务和用户挖掘平台的实现与应用

被引量 : 5次 | 上传用户:jxhxf0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的来临给各个行业带来了翻天覆地的变化,人们已经逐渐意识到数据的重要性。大数据的巨大作用已经渗透到各行各业中去,成为了继云计算、物联网之后IT行业又一大颠覆性的技术革命,也成为决定行业决策和未来走向的重要因素。从依靠因果关系做决策到依靠数据的内部关联做决策,是大数据对于人类的最大贡献。随着移动互联网技术的高速发展和网络数据采集技术的逐步完善,通过网络网关,运营商和设备商可以采集到更多维度、更加详尽、结构复杂的网络数据。此外,移动网络的发展也在逐步影响用户的群体行为规律,随着LTE技术的高速发展与广泛应用,移动用户传统2G、3G相比具有不同的话务模型和业务模型,无线网络已经进入了大数据时代。因此,从数据复杂度和数据容量两个方面来看,传统的数据分析平台已经不再适用于如今的无线网络现状。论文首先采集了国内几个典型城市不同蜂窝无线网络环境下的业务统计数据,蜂窝网络包括CDMA2000、WCDMA和LTE等;由于数据总量达到TB级别,采用了多种数据仓库存储原始数据来应对不同的应用场景。其次,针对数据字段众多、结构复杂等特点,提出了一种数据细分的方法,将不同协议的网络数据进行拆分和汇总,实现不同协议数据间的有效整合和对比。再次,论文详细分析了这些数据的数据类型特点和规律,依据移动互联网多类型数据特点,对数据进行了详细分类和挖掘分析,并提出了基于聚类分析的业务与资源的多维度预测方法以及基于KNN分类算法的最佳匹配预测方法,分别从用户、业务和网络等多个角度给出了大数据挖掘分析的结果和应用。最后,基于对大量移动互联网数据的详细分析和深入挖掘,搭建了一个基于Hadoop的无线网络业务和用户行为挖掘平台,平台充分运用运用Hadoop的大数据处理能力,实现了对6个典型城市、4个月的时间范围、数十亿级别的数据处理和分析。通过对海量现网数据的分析和挖掘,探寻数据内部规律和关联,实现网络性能的调优、用户体验的提高与无线网络的精细化运营。
其他文献
大卫·米切尔(David Mitchell)的《云图》(Cloud Atlas)是千禧年来小说中的一部佳作。《云图》中的六个故事发生在六个不同的时代和地点,作者也采用了六种截然不同的写作风格
1.研究背景绝经后骨质疏松症骨折是绝经后骨质疏松症(Postmenopausal osteoporosis,PMOP)最具破坏性的结局。目前已为危害中老年妇女身体健康的严重疾病。如何有效的早期预测
随着近年来滑雪运动在中国悄然兴起,很多地区快速完成了滑雪场地的建设,国内滑雪人数呈跳跃式增长,冰雪旅游发展呈现出令人振奋的势头。天然的滑雪场已不能满足国内特别是南方地
当下,文化已成为衡量国家或地区发展的重要指标,成为国与国之间新的竞争领域,十七届六中全会正是在此背景下提出了建设社会主义文化强国这一重大发展战略。文化硬实力不仅是
1985年瑞典皇家学院将诺贝尔文学奖颁发给了克洛德·西蒙。得奖时,西蒙已孜孜不倦地在文学道路上探索了四十多年,本文所要研究的《农事诗》(1981)是其耗时最久的一部作品,以
随着互联网的极速发展,互联网产生的信息数据成爆炸式增长。互联网已经从信息匮乏迅速转入信息过于庞大而难以甄选有效信息的时代。文本信息作为传递信息的一种载体,依然是人
软件定义网络(Software Defined Networking, SDN)通过软件的形式重构了现有网络,其集中控制、控制与数据分离以及可编程开放等特性对未来网络技术的发展产生深远影响。从安
随着互联网的迅速发展,特别是近年来,突飞猛进的移动互联网和电子商务的发展,网络已经进入了互联网+时代。“互联网+”时代具有如下特点:大规模数据集,多终端等。企业建立一套IT系
传统园艺栽培与管理中存在着大量需要依靠人的视觉进行辨识和计量的繁重劳动。应用先进的机器视觉技术可以使得这些工作实现自动化与智能化,从而显著降低劳动强度,提高工作效
快速伸缩复合训练(Plyometrics)是一种有效发展速度的一种方法,它将速度和力量巧妙的融合在一起。快速伸缩复合训练(Plyometrics),是通过离心-向心收缩,在尽可能短的时间内使肌肉达