基于用户行为规律的群体识别方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:cwhgh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代信息技术以及计算机技术的飞速发展,互联网中产生了大量的数据可供挖掘使用,同时随着无线通信技术的快速发展,产生出了大量的移动对象数据,这些数据中蕴含着移动对象的行为信息,体现了个体及群体的时空动态性,通过分析目标用户的移动数据可以帮助我们了解个体及群体的行为规律、发展动向等信息。其中,群体识别一直是备受关注的热点,广义上的群体识别是指将目标对象根据指定的特征信息区分为各个团体进而识别出各个团体的行为,具体主要研究集中在群体行为识别及群体异常识别等领域,侧重点各有不同,具有重要的研究价值与广阔的应用前景,如行为预测、目标跟踪、安全防护以及交通流量分析等。本文采用数据挖掘方法,根据用户移动轨迹信息提取其停留点,进而利用一种快速简便的聚类算法挖掘用户的停留区域,同时结合POI信息挖掘与停留区域相关的语义信息,将与用户停留区域相关的地理位置信息和语义信息作为用户的特征信息,自定义了用户相似度公式,并通过共享最近邻聚类算法对用户进行聚类以挖掘其中具有强关联性的群体。实验表明,本文提出的方法对具有强关联性的特殊用户群体挖掘效果良好,为后续的监控跟踪提供了良好的技术支撑。本文主要的研究工作如下:1、提出了一种分层提取停留区域地理位置信息的方法。利用用户轨迹信息中的地理位置和时间标签,检测其在某段时间周期内的停留区域以及到访各个停留区域的频繁程度,实现了对目标用户停留区域地理位置信息的快速准确挖掘。2、提出了一种基于POI信息和LDA主题模型的语义信息提取方法。POI信息中包含的类别信息一定程度上可以反应出用户行为活动,用该信息作为语义,并采用LDA对信息文字隐含主题进行建模,得出用户语义信息概率分布。3、提出了一种基于权重的用户相似性度量方法。本文结合了用户地理位置信息、语义信息及各个位置对应的到访频度定义了用户相似度公式,充分利用用户轨迹数据中包含的信息体现用户特征。4、提出了一种基于共享最近邻的用户群体聚类方法。采用这种强调用户之间紧密关系程度的聚类算法可以有效去除大量噪声点,发现紧密关系群体。
其他文献
<正> 司马光是我国古代杰出的史学家,他以《资治通鉴》这部巨著而著名于世。王夫之则是我国古代卓越的史学评论家,他的史论著作很多,如《尚书引义》、《春秋家说》,《春秋世
在现代市场经济中,企业为了增强销售过程中的竞争力,越来越多地采用信用销售方式。伴随而来的 必然是越来越多的应收账款和如何控制应收账款的增长。
知识型团队是知识密集型企业的基本学习单位和业绩单位,团队的知识共享是知识密集型企业知识管理的关键。而信任和知识距离是对团队知识共享具有实质影响的两类因素,信任决定了
随着教课程标准的改革,对于教育需要进行更多的资源投入和方法探究,科技的发展和信息化时代的到来给我们的教育指明了新的方向,特别是数控车工这样的技术类教学课程,更需要贴
从后殖民主义的理论视角解读格雷厄姆&#183;格林的小说《问题的核心》,特别是对文本的殖民话语的分析,可以看到格林把殖民地引入自己的作品中时,是以西方人的目光来注视殖民地的
<正>2013年秋季,我在霍普金斯大学莱斯特·萨拉蒙领导的公民社会研究中心做访问学者。借这个机会,我参观了巴尔的摩和华盛顿地区的一些非营利机构。东巴尔的摩公司(以下简称E
文章针对分离式钢箱梁在大跨度斜拉桥中的应用,对分离式钢箱梁的连接横梁相对薄弱、构造复杂等特殊性,采用有限元软件Ansys建立空间有限元计算模型,研究分析横梁的详细受力情
在总结有关文献的基础上,介绍了电还原,电氧化,电凝聚,电气浮和微电解在水处理中的应用.分析了电化学法水处理技术的发展动向主要体现在电极材料、供电方式、电化学反应器的结构及
本系统立足集成和创新,结合建设行业信息技术实际应用状况和国际上信息技术发展趋势,确定城市数字化标准规范与相关工具、城市数字化体系结构与信息集成关键技术、城市数字化