基于手机上下文的用户频繁模式挖掘技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:zhangnly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,智能手机的软硬件都得到大大提升。不断被嵌入手机的各种传感器如加速计、麦克风、GPS等在提供丰富功能的同时,还能收集大量与用户相关的传感器数据。这些数据经过一定的处理和计算,便形成了可以描述用户生活的上下文,例如GPS数据可以推测用户所在的位置,加速计可以感知用户的活动,电话和短信记录反映用户的社交等。由于上下文数据反映了用户的生活状态,如何从用户手机的纵向多源上下文数据中挖掘用户的行为模式,是当前研究的热点和难点。论文围绕如何从手机上下文中挖掘用户的频繁模式展开研究,首先对传感器数据进行预处理以获得有用的上下文数据,在此基础上,重点研究了纵向多源上下文的处理技术,进而深入研究了在手机上对个体用户频繁模式的挖掘,最后借鉴众包思想,研究了基于云的群体频繁模式挖掘框架。本文的工作主要体现在以下三个方面:1)不同于以往对时域数据使用固定时间窗口的方法,针对纵向多源上下文数据的特点以及关联规则挖掘的需要,本文提出了一个动态时间窗口算法来处理上下文数据,具体地讲,首先根据用户的交互活动(包括电话、短信、应用软件的使用记录)动态确定时间窗口,2)为了实现在手机上对个体用户频繁模式的挖掘,考虑手机处理能力的限制,本文提出了一个频繁模式挖掘模型,通过对频繁模式的分析定义,确定了两个关键的因素,即用户交互活动的持续时间和出现频率,然后基于传统的Apriori挖掘算法,在支持度的定义上对上述两个因素进行加权,从而获得更加客观准确的频繁模式。此外,挖掘模型还对挖掘结果进行进一步的可视化处理,对用户在不同地方和不同时段的行为模式进行展示,方便用户随时了解自己的日常行为模式。3)在上述研究基础上,针对群体频繁模式的挖掘问题,本文设计实现了一个基于云的挖掘系统,对用户上传的频繁模式汇总后进行二次挖掘。由于不同用户频繁模式的差异,为保证结果能反映群体的特征,本文扩展了Apriori挖掘算法,使用用户频繁模式的支持度和比重作为一个附加权重。云框架使用了百度云应用引擎进行实现,通过实验验证了算法及框架的可靠性和实用性。
其他文献
金属制品表面缺陷的检测有着重要的现实意义,因而对于金属图像的处理显得尤为重要。本文从分析标准图像的降噪算法出发,设计更优的降噪算法,并最终应用于金属图像。小波分析
网络层组播可以比单播更高效地实现一对多或多对多的数据分发,能显著提高网络资源的利用效率。然而,传统的网络层组播技术存在着路由器转发状态数膨胀、部署成本高等问题,阻
CNGI应急联动内部管理系统是在CNGI应急联动系统中实现各类数据管理、查询和维护的平台。系统基于Client/Server模式,是多用户、多角色应用系统。不同角色的工作人员能够通过
随着互联网的飞速发展,信息的分享、获取和发布进入了一个新时代。Web服务解决了传统网络应用程序的分布式对象、中间件技术的相互独立性和紧耦合性,其诸多优点使得不同分布
随着下一代全球互联网络的研究和发展,IPv6势必将取代IPv4,被广泛运用到各种有线和无线网络中。而作为一种自组织、自管理和不需要基础设施的网络,Ad Hoc网络以其自身的特性
由于深空网络相较于地面网络具有高误码、超长时延和突发丢包的特点,现有的传输机制难以满足其高效传输的要求。为了解决深空网络的文件传输方面的困难,本文通过在深空网络传
近年来,随着计算机技术的不断提高,以高性能计算机为基础的数值天气预报也有了飞速发展。垂直坐标系作为数值模式垂直离散的基础,对于模式预报性能具有重要影响,混合?-p坐标
文字是计算机进行情感识别的一种重要形态。今天计算机使用者所面对的主要是以文字形式表示的信息。传统上的文本分类往往关注于把文本映射到给定的主题,如体育、经济、政治
步态识别作为一种新兴的生物特征识别技术,近年来得到了研究人员广泛的关注,由于它具有远距离识别,需要的图像分辨率较低,不需要配合以及无侵犯性等优点,因此是很多情况下唯
图像复原的研究在图像处理研究初始就已经开始了,但是由于图像未知的退化过程,以及逆过程的病态性,使得图像复原十分具有挑战性,至今仍是一个被大量研究的热点方向。按照图像