基于蜂窝网络数据业务的时空分析与用户兴趣挖掘

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:sxsj002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着3G、4G网络的普及,移动互联网得到了快速发展,同时伴随着移动终端市场的成熟和智能终端的推陈出新,蜂窝网络的用户规模也不断扩大,蜂窝网络数据业务成为了人们的重要研究对象。随着蜂窝网络数据流量的与日俱增,如何利用大数据技术分析研究海量蜂窝网络数据已经成为了当今的研究热点。对海量的蜂窝网络数据进行分析与研究,一方面将有效地促进现有蜂窝网络建设的规划,从业务角度来提升网络的性能;另一方面,通过蜂窝网络数据挖掘出隐含的、有用的信息,已经成了商业、工程领域的迫切需求。本文通过搭建蜂窝网络大数据平台,对蜂窝网络业务数据进行研究。对大尺度下的城市快照时空模式进行了分析,同时在小尺度上挖掘用户的搜索兴趣。论文主要工作包括:一、基于现有的Hadoop、Spark等大数据技术,并结合蜂窝网络数据业务的处理需求,搭建了一套用于蜂窝网络数据分析的大数据分析处理平台。然后详细阐述了该平台下的数据采集模块、数据存储模块、数据处理模块、数据展示模块4个核心模块和其中的关键技术。最后,描述了本文使用的大数据系统中遇到的关键问题以及解决方法。二、基于即时通信业务流量,提出了一种城市的业务快照模式的分析研究方法。首先给出了一种业务快照的建立方式,并且基于图像识别中图像相似性衡量概念,对比了业务快照峰值信噪比(S-PSNR)与结构相似性(S-SSIM)的快照衡量方式。然后使用非加权组平均法(UPGMA)对快照进行聚类分析,发现提出的城市快照空时模式与传统的时空模式对比,可以更为准确并精确地得到一个城市工作日与周末的用户行为模式。最后对不同业务量城市间的聚类结果进行模式对比分析,挖掘出高业务量的城市用户有着较为明显的日常行为模式。三、基于蜂窝网络搜索业务,进行了用户搜索兴趣挖掘以及兴趣预测。首先提出一种蜂窝网络搜索数据的词条解析方案,并根据搜索词条建立了特殊的短文本分类器,将搜索词条进行兴趣映射。接着对用户的搜索兴趣进行时空分析,时间上可以根据搜索量分为3类,空间上得到搜索兴趣与实际地理POI有着密切联系。最后建立用户搜索兴趣轨迹,提出一种基于Apriori的兴趣模式挖掘算法。并此基础上提出一种兴趣预测算法,经过验证比较,与基于一阶马尔可夫模型的兴趣预测算法先比准确率平均提高了 18.57%。
其他文献
自2006年胡锦涛总书记第一次提出“社会主义荣辱观”以来,针对大学生的社会主义荣辱观教育取得长足发展。特别是十七届六中全会进一步提出“要深入开展社会主义荣辱观宣传教育
20世纪90年代以来,中国经历了6年大规模的扩招,在大规模扩招的背后,高校存在重科研、轻教学,重学科学位建设、轻基本建设和重外延扩张、轻内涵建设等倾向,使得本科教学质量存
从本质上说,教育是一种伦理行为,幼儿园教育的每一个细节都充满着伦理意味。当专业伦理之光照不进幼儿园保教的现实,困境的萌芽就会于无形中滋生蔓延,幼儿园教师就会因伦理困
电力企业的安全管理重点在于班组安全管理,可以通过抓好班组安全管理的重点措施、日常措施、作业现场措施,逐步创建“危险预知、隐患可控、机制有效、事故为零”的本质安全型
独立学院在我国高等教育发展中扮演着重要角色,已经成为我国高等教育大众化进程中不可或缺的重要组成部分。眼下,在日益激烈的市场竞争中,高校之间的竞争已逐渐演变成为师资
擦大钹舞蹈作为保山徐掌村民间文化的一种艺术形态,其独特的表演方法和道具使用体现出了当地特殊的地理环境、生存方式以及民间风俗。同时,其发生与流传的地域局限性使其艺术形
目的:探讨针刺对血管性痴呆(VD)大鼠脑组织中引起细胞凋亡相关蛋白Caspase-3、NFK-βp65及PTENmRNA表达的影响,为临床治疗血管性痴呆提供理论依据。方法:将水迷宫测试合格的
人是科技进步和社会发展的最活跃因素和主导力量。人自身的和谐发展既是人类个体发展的需要,更是整个人类社会不断实现质的飞跃的迫切需求。在我国,大学生作为推进社会发展的一
本文界定了受教育机会的概念,并提供尼日利亚高等教育需求与供给的相关证据。据报道,尼日利亚每年申请入学的考生中仅有5.1%至17.3%被录取,这意味着每年大约82.7%至94.9%的尼
对于大型图像库,如何高效地检索出相似图像是图像检索系统的一大挑战。提出了一种改进的K-均值聚类算法建立分层结构的索引,再利用A*树算法和三角不等式原则及N近邻方法对索引