论文部分内容阅读
对用户行为时空规律的深入理解,在许多领域具有巨大的应用价值。典型的应用场景包括信息传播,个性化推荐,商业智能等。人类动力学作为一门研究人类行为的学科,已经形成一套成熟的框架。利用领域内的经典理论和模型可以对用户行为进行有效的分析;然而用户数据具有复杂和多维的本质属性,这使得使用基于先验知识的手段去洞悉用户行为会面临一些障碍,而人的视觉识别能力和自身的经验直觉尤其适合处理这类问题。基于此,本文主要做了以下研究工作:(1)人类动力学时空特性统计分析。利用人类动力学理论,对用户签到行为的时空特性规律进行验证和分析。时间特性方面:群体用户的签到行为时间间隔分布近似服从幂指数为2.64的幂律分布;群体层面的分布幂指数随活跃性单调增加,个体层面的分布幂指数和活跃性呈正相关;用户签到行为的阵发与记忆性较为发散,此外用户签到行为还表现出明显的周期性和波动性。空间特性方面:群体跳转距离分布服从幂指数约为1.394的幂律分步;用户回转半径随时间收敛最后趋于稳定;用户访问唯一地点数量随时间幂律增长;用回转半径对跳转距离进行重定标,结果显示不同回转半径组别的群体跳转距离分布塌缩到一条曲线;用户在t时刻返回历史轨迹点的概率分布具有周期性且最终趋于稳定;这些现象说明用户的出行模式具有有界性、周期性及规则性等特点。以人类动力学先验知识和上述统计结果为出发点,利用数据可视化理论对用户行为进行更深层次的分析。(2)可视化算法设计。首先明确可视化算法的作用,基于算法需求展开算法设计工作。对于空间属性,利用墨卡托投影算法进行地理坐标映射,用地图描点编码签到行为;对于时间属性,利用堆叠图算法表现多种签到行为的时序变化以及它们之间的对比;利用日历热力图算法探查更细微时间粒度上的特性;利用经改进的前链圆填充算法,展现地点-用户-类型签到-单次签到的层次结构;基于钟表的隐喻设计了钟表映射算法,利用表盘时序活跃度的变化探索地点的功能。(3)可视化系统实现。首先分析了系统的设计需求,从系统架构图出发,展开了系统功能设计,详细描述了经可视化算法映射实现的多个视图以及交互模块的功能,以系统架构为基础,遵循系统流程图的流程,利用交互模块联接多个视图并实现了丰富的交互功能,从而构建了可视分析系统。最后从用户界面概览出发,通过五个典型的案例分析证实了系统的有效性。