基于贝叶斯模型的用户日常移动模式分析方法的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:sk1011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通信技术的飞速发展,越来越多的用户在日常生活中使用手机。为了提供移动服务,移动基站会时刻监测开机用户的当前位置以及时间戳。基于基站收集到这些用户移动信息,能够有针对性地进行手机用户的移动模式分析。用户移动模式分析具有十分重要的应用意义。典型的应用如优化基站位置管理服务,基于位置的移动增值服务,交通高峰期预,广告推荐(餐饮,商店,旅游)等等。   由于用户移动信息的时间,空间特性,分析用户移动记录时需要有效地对时间,空间之间的关系进行建模。在发现由时间,空间点组成的隐含模式的同时,还需考虑经常重复这一模式的某些群体用户。目前已有的用户移动模式分析方法无法在建模时同时考虑这几方面问题,因此建模效果并不理想。   由于移动用户数量庞大,且用户每天产生的移动记录数目很多,用户移动模式分析方法需要能够有效地处理大规模的用户移动数据。因此如何提高算法的效率和可扩展性也是十分重要的研究问题。   本文提出了一种基于贝叶斯模型的用户移动模式分析算法BDMP(Bayesian-based Daily Moving Pattern algorithm),能够有效地对移动记录中的时间,空间关系进行建模,并描述用户与不同时间点,空间点之间的依赖关系。其建模结果能够发现一些隐含的移动模式,每个移动模式被一群用户重复,由一些空间点和时间点组成,且移动模式中的所有元素都能够依据概率排序。模型可解释性强而且能够用于新用户的移动模式预测。本文在MIT Reality Mining数据集以及中国移动数据集上对BDMP模型进行了实验,实验结果表明BDMP模型不仅在建模效果上而且在预测能力上都优于已有模型。   为了进一步将BDMP模型用于大规模数据,本文设计了两种并行BDMP算法。一种基于MPI机制,一种基于MapReduce框架。这两种方法都充分利用了多个处理器的并行计算能力。在中国移动的大规模数据集上实验表明MPI-BDMP算法和MapReduce-BDMP算法都具有很强的并行性和可扩展性。
其他文献
随着科学技术和电子制造业的发展,在PCB制造过程中,PCB上的元器件安装普遍采用表面贴片安装技术。由于贴片元器件体积小,安装密度大,电路板的集成度进一步提高,传统的检测技术和方
随着系统芯片(System-on-a-Chip,简称SoC)需求的发展和微软Windows操作系统(简称MS Windows)普及度的广泛深入,MS Windows兼容系统芯片变得越来越重要。但是复杂的系统芯片设计和闭
学位
随着计算技术的发展,使海量信息得以存在并迅猛增长。近年来商务智能、生物信息学、社会网络分析等新兴应用领域的迅速发展,对海量信息的有效利用提出了迫切的要求。我们正处于
纸币号码具有唯一性,可以用来标识纸币的身份。在银行或其他金融领域常常需要对纸币号码信息进行采集,用于分类和防伪鉴别。当前纸币号码的登记录入工作主要是通过手工完成的,设
随着我国经济的快速发展,人们的生活品质迅速提高,对水果等富含维生素的食物摄入需求也越来越高,而作为更便携、易保存的工业产品,果汁饮料更受人们的青睐。地处华南的广东,盛产荔
为满足EAST实验中实验信息交互对象的多样性和实验人员远程交流的需求,提出了基于可扩展消息处理现场协议XMPP协议的即时通信系统方案。本文在对该协议进行了深入研究的基础
学位
回归测试是软件开发和维护期间保证软件新增加的功能或组件的质量,并保证原有的功能不受软件变更的影响的重要过程,它需要消耗大量的资源。重用已有的测试用例不仅能够减少生成
人工免疫算法的发展方兴未艾,在众多领域得到了广泛的研究应用,因此深入开展这方面的研究是十分必要的。本文首先研究了生物免疫系统以及人工免疫系统的基本原理,为进行免疫
随着Internet的飞速发展,Web上的信息量越来越大,通用搜索引擎在信息采集、存储等方面都将面临更加严峻的挑战。此外,通用搜索引擎面向Web上所有的检索用户检索不同类别的各种信
学位
入侵检测技术通过收集计算机或网络中若干关键点的信息,来监视计算机或网络系统的运行状态,以发现各种攻击企图、攻击行为或者攻击结果。入侵检测有两种主要的检测技术:误用