基于移动特征的显著地点挖掘算法及应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yang980060
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能移动设备的广泛应用,人们的日常行为很容易被拥有位置记录功能的设备所获得并存储。被记录的这些位置数据不但清楚地标识了用户所在的物理位置,而且还隐含了用户的一些潜在信息。如果对这些物理位置中显著地点进行挖掘和分析,可以进一步发现用户的兴趣和偏好、用户的工作性质、城市资源分布情况等等。因此,对显著地点所隐含的信息进行挖掘研究具有重要的理论和实际意义。已有的显著地点挖掘算法的研究通常基于条件过滤、聚类或者数学模型方法,存在着准确度不高、计算开销大、容错率低和解释性差等缺点。为此,提出了一种基于移动特征的显著地点挖掘方法MMC(Mining based on Movement Characteristic)。首先,根据用户在实际中的移动特征,确定“徘徊”状态临界阈值;其次,计算用户轨迹中各位置的瞬时速度,并排除其中速度高于“徘徊”阈值的连续噪声段,紧接着由每一段徘徊轨迹生成候选地点;最后,将实际中相同的候选地点进行合并,得到用户的显著地点列表。为了验证算法的有效性和正确性,实验采用由Geo Life项目真实采集的用户移动数据为数据集。利用MMC来进行显著地点的挖掘,并与K-Means方法进行了对比,实验结果表明,MMC能更加准确的从GPS移动轨迹中挖掘出用户的显著地点,而且效率较高。以显著地点挖掘研究成果为基础,研究了MMC算法在推荐系统中的具体应用,即根据用户的显著地点列表发现相似用户。首先,以MMC算法挖掘的显著地点为特征,结合访问频率和访问时间区间两大影响因素,定义用户-地点相关度,度量用户与显著地点之间的相关性;其次以用户与显著地点列表中所有地点的相关度构建用户相关向量,描述用户特征;然后,将两个用户的显著地点列表合并,计算各用户基于该集合的相关向量;最后,根据相关度和相关向量乘积法则运算得到用户之间的相似度。使用该方法对MMC的挖掘结果抽样进行相似用户的发现,对比用户地点列表在地图中的分布,结果表明,该方法能更好地发现相似用户。
其他文献
遥感技术在环境监测、国土资源勘探、军事侦察以及考古等许多领域中发挥着越来越重要作用。而航空遥感以其特有的机动灵活和反应快速的特性,在应对各种突发事件以及各种灾害的
分布式文件系统自上世纪70年代出现以来,经过30多年的发展,已经逐渐趋向成熟,在数据处理、信息服务、商业系统、教育科研等各个领域都有广泛的应用。分布式并行文件系统(DPFS
近年来,随着计算机技术的飞速发展,嵌入式系统的应用越来越广泛。随着对嵌入式系统的要求越来越高,嵌入式系统的图形用户界面(Graphic USer Interface)对于嵌入式系统来说就
近几年来,基于角色的访问控制RBAC(Role-Base Access Control)作为访问控制的一个领域得到了迅速发展。其基本思想是通过角色来实现用户与权限之间的逻辑隔离,从而简化对访问
在大数据时代,数据流编程语言相对传统的面向对象的编程语言有着明显的优势,但是在任务调度优化的过程中,要得到负载均衡的划分结果并非易事。特别是在多媒体领域,数据流程序
网络编码(NC)自问世以来便受到广大学者的青睐。通过改变传统网络中路由的存储—转发模式,把编码的观念加入到中继节点中。采用这种策略,我们能够实现网络容量最大的目的。由于
随着信息技术的飞速发展,决策人员在进行决策分析时对各方面信息和数据的依赖性越来越强,于是在数据库的基础上产生了满足决策分析所需要的数据环境—数据仓库。在构建数据仓库
文本分类是一个传统而又历久弥新的话题,在互联网技术日益发达的今天,其应用越来越广泛。在文本分类的过程中,由于用特征向量表示文本时的高维性、高稀疏度等特点,特征选择显
BSP(Board Support Packet——板级支持包)是介于底层硬件和上层软件之间的底层软件开发包,其主要功能为屏蔽硬件,提供操作系统的引导及硬件驱动。Linux操作系统目前已发展为
面向对象数据模型将面向对象思想与数据库技术相结合,以一种很自然的方法解决了传统信息项目中遇到的诸多问题,面向对象方法作为理论时下已应用到绝大多数信息化系统设计中。面