论文部分内容阅读
随着信息技术及互联网的发展,尤其是移动互联网的兴盛,社会媒体作为一种新型的允许人们创造和分享媒体信息的工具和平台,在近年来得到了飞速的发展,吸引着全球数以亿计的用户参与其中。同时随着地理位置定位技术的发展,特别是移动智能手机的普及,基于用户地理位置的服务成为主流应用。在这一背景下社会媒体和地理位置相结合形成了地理社会媒体。地理社会媒体涵盖各种形式的带地理位置特征的社会媒体网站和服务。地理社会媒体使得用户可以随时随地获取和分享信息,产生了海量的带地理位置信息的社会媒体数据,其具有巨大、异质化、多模态、空时性的特点。海量的地理社会媒体数据与用户需求的信息之间存在着“知识鸿沟”。因此,如何对地理社会媒体进行有效地挖掘和利用,提取知识进行应用服务,成为未来互联网发展的关键。 地理社会媒体包含了地理位置、用户、数据三个基本元素,三个元素相互联系作用。一方面,用户感知地理位置,产生大量的带地理位置标签的媒体数据,通过汇聚挖掘这些地理媒体数据可以理解地理位置;另一方面,用户产生大量的在线交互活动行为数据,与媒体内容数据结合研究可以分析理解用户。因此,我们开展面向地理社会媒体的挖掘与应用的研究,从用户感知的地理社会媒体数据挖掘知识用于理解用户和地理位置,从而进行提供有价值的应用服务。特别地,我们把语义理解、知识挖掘、应用服务统一结合起来,贯穿到研究问题中,进行了如下三个方面的研究工作: 地理位置计算。用户产生的带地理位置信息的社会媒体数据蕴含了重要的关于现实世界的信息知识。地理位置计算以地理位置为中心,旨在利用带地理标签的媒体数据,结合地理位置信息和多媒体语义,进行地理位置的建模和知识挖掘,包括地理位置的建模识别、主题特征发现和观点挖掘及情感分析。挖掘的地理位置知识可用于地理位置识别、可视化和探索发现等应用。 用户理解。为有效地满足用户对所需信息的获取,除了多媒体内容语义分析,还需要对用户建模分析,理解用户的兴趣分布和意图。这一研究方向以用户为中心,利用用户产生的大量的媒体内容数据和丰富的用户网络行为数据进行用户分析建模,获取用户的特征信息及行为模式。具体的研究问题包括用户属性推断和用户影响力建模。 用户与地理位置结合的建模分析。从地理社会媒体数据挖掘得到的地理位置和用户的知识,需要通过有价值的应用送达给终端用户,满足用户的需求。这一方向把用户、地理位置、地理社会媒体数据在一个框架内进行建模,挖掘融入地理位置和用户的知识,建立推送机制,为用户提供探索发现服务。 围绕上述三个方面,论文的具体工作和贡献有: 1.基于地理属性的地理位置识别。提出一种基于区域隐式支持向量机模型框架来挖掘一个地理区域中具有代表性和判别性的地理属性帮助进行地理位置识别。此外,对挖掘的地理属性做了语义解释,可用于地理位置探索服务。 2.多主题的地理位置可视化。提出一种系统性的可视化方法框架来自动地发现一个地理区域中的地理兴趣点与语义主题进行地理区域可视化。 3.地理实体的多模态主题特征观点挖掘与情感分析。提出一种概率图模型来利用实体的多源媒体数据自动挖掘出实体的多模态主题特征与对应的观点,这样有效地丰富了地理实体的知识图谱维度。此外,对挖掘的观点做了情感分析,并联合主题特征观点,进行了实体关联可视化。由挖掘的多模态主题特征与观点,设计实现了检索任务的应用。 4.关联性用户属性推断。系统性地研究了六种用户属性:性别、年龄、情感状况、职业、兴趣、情绪倾向。提出一种关联性隐式支持向量机模型框架并利用用户产生的媒体内容特征和属性关系进行用户属性推断。提出的模型框架可以用于用户画像和基于属性的用户检索。 5.主题敏感影响者的挖掘。提出一种基于超图学习的方法框架并利用社会媒体网络中用户产生的媒体内容与链接关系挖掘主题敏感影响者。挖掘的主题敏感影响者可用于好友推荐和媒体信息推送服务。 6.场景化个性化的地理位置推荐系统。针对用户在移动场景下的地理位置评分行为的特性,提出一种场景感知回归混合模型对时空场景信息、用户兴趣、地理区域偏好、地理物品与内容进行统一建模并实现推荐。联合提出的模型,提出了一种用户意图和地理位置感知的概率矩阵分解模型,可以融入地理位置与用户的知识,有效地缓解了数据稀疏性问题从而提高了推荐性能,促使用户能够进行当地和新地点的探索发现。