论文部分内容阅读
用户行为理解对于提供个性化服务和广告投放有着极为重要的意义。一方面,随着近年来智能手机的普及以及移动互联网的蓬勃发展,越来越多的用户位置信息能够被精确地记录和获取。这些位置信息真实地展示了用户在生活中进行用餐、购物、旅游等与物理世界紧密相连的行为,能够准确和完整地反映用户的生活状态和兴趣习惯。现在普遍采用的位置数据包括了GPS轨迹、手机的基站定位数据、公共交通卡记录的上下车站信息、基于位置的社交网络签到数据、无线网络的定位数据以及图片的位置标记数据等等。另外一方面,电子商务近年来飞速发展,像阿里巴巴和京东这类电商平台的网络购物已经是国民整体消费的重要组成部分,这些电商平台所记录的消费数据能够很大程度上反映出用户的消费偏好和兴趣爱好。通过对这些精确量化的消费数据进行深度挖掘,能够更好地理解个人以及群体的消费行为模式,从而可以设计出更精准的推荐系统向用户推荐感兴趣的物品。用户的位置数据和消费数据是相辅相成的,一方面用户在物理世界的移动规律能够折射出其在消费方面的偏好,反之通过对用户消费行为习惯的挖掘也能够推测用户在真实生活中的移动模式。把这些信息有效的结合在一起能够更加深入和准确地理解用户行为习惯,为完善推荐系统和精准的用户定位提供有效的支持。本文围绕大规模的位置数据和消费数据,从具体应用的角度出发针对用户理解展开了深入研究,这些研究成果体现了重要的学术研究价值以及广泛的应用场景。具体而言,本文的主要研究成果、贡献和创新点可以慨括为如下几点:·提出从轨迹数据智能感知用户的加油消费规律,从位置数据的角度挖掘了用户的消费模式。本文通过对出租车的移动轨迹、城市兴趣点的地理位置数据库以及城市的路网拓扑结构进行建模,实现了一个能够自动检测加油事件,推断用户加油时间和估计顾客数目的智能系统。这个系统主要包括三个模块,第一个模块通过对出租车的轨迹数据进行分析和挖掘,采用静止点检测算法发现可能的候选加油事件,然后通过提取候选加油事件的时空特征使用随机梯度树模型过滤掉非真实的加油事件;第二个模块首先对时空进行划分以确定每个时空单元的加油事件,然后通过情境感知的协同过滤学习模型来推断在用户在某个时间去某个加油站的时间消耗;第三个模块进一步根据所得到的加油时间消耗,使用排队论模型来估计加油站内的顾客数目。该文通过真实数据和实地测试相结合的方式,充分验证了该智能系统的有效性和可靠性。·提出从智能卡的消费中挖掘用户的位置移动规律,从消费数据的角度挖掘了用户的位置移动模式。本文基于用户公交智能卡的消费信息,采用半监督随机场模型并融入多空间对齐的约束以及协同过滤学习得到的隐空间特征来智能恢复没有记录的上下车站位置信息。这个模型包含三个步骤:第一步根据地理、时间以及金钱三个维度存在的约束过滤不符合条件的候选上下车站:第二步提取半监督条件随机场模型所需要用到的各种特征;第三步提取单个车站乘坐的约束概率以及车站换乘的约束概率并融入模型作为先验知识,接着训练历史数据和恢复没有记录的乘坐车站信息。多维度的实验结果证实了本文的方法能够准确地恢复用户上下车站的移动信息。·提出从移动和消费行为来挖掘用户的猎奇心理特质,同时从位置数据和消费数据的角度挖掘用户的心理特征。本文基于用户在位置社交社区的签到位置数据和电商平台的在线购物数据,使用基于贝叶斯图结构的猎奇心理模型来准确地刻画出用户在相对于个人和相对于群体两方面的猎奇特质。该工作主要包含三个步骤:第一步是构建一个通用的猎奇心理模型,这个模型采用贝叶斯图结构,把用户表现出来的时间序列行为表示为能够观察到的显式变量,同时把用户的猎奇心理特质以及效用偏好表示为隐变量,通过模型的生成过程来表示用户的行为模式;第二步具体分析了用户的位置数据和在线购物消费数据,来深入理解用户在移动行为和消费行为中分别展示出来的猎奇心理特质;第三步通过大规模的真实数据验证了所提出模型能够准确的刻画用户的猎奇心理特质分布以及在预测用户行为方面展示出来的优势,然后进一步对比了用户在这两个领域所展示的猎奇心理特质的一致性,为跨领域的用户定位和推荐系统设计提供了依据。