面向地理社会媒体的挖掘与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:hblhzl_18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术及互联网的发展,尤其是移动互联网的兴盛,社会媒体作为一种新型的允许人们创造和分享媒体信息的工具和平台,在近年来得到了飞速的发展,吸引着全球数以亿计的用户参与其中。同时随着地理位置定位技术的发展,特别是移动智能手机的普及,基于用户地理位置的服务成为主流应用。在这一背景下社会媒体和地理位置相结合形成了地理社会媒体。地理社会媒体涵盖各种形式的带地理位置特征的社会媒体网站和服务。地理社会媒体使得用户可以随时随地获取和分享信息,产生了海量的带地理位置信息的社会媒体数据,其具有巨大、异质化、多模态、空时性的特点。海量的地理社会媒体数据与用户需求的信息之间存在着“知识鸿沟”。因此,如何对地理社会媒体进行有效地挖掘和利用,提取知识进行应用服务,成为未来互联网发展的关键。  地理社会媒体包含了地理位置、用户、数据三个基本元素,三个元素相互联系作用。一方面,用户感知地理位置,产生大量的带地理位置标签的媒体数据,通过汇聚挖掘这些地理媒体数据可以理解地理位置;另一方面,用户产生大量的在线交互活动行为数据,与媒体内容数据结合研究可以分析理解用户。因此,我们开展面向地理社会媒体的挖掘与应用的研究,从用户感知的地理社会媒体数据挖掘知识用于理解用户和地理位置,从而进行提供有价值的应用服务。特别地,我们把语义理解、知识挖掘、应用服务统一结合起来,贯穿到研究问题中,进行了如下三个方面的研究工作:  地理位置计算。用户产生的带地理位置信息的社会媒体数据蕴含了重要的关于现实世界的信息知识。地理位置计算以地理位置为中心,旨在利用带地理标签的媒体数据,结合地理位置信息和多媒体语义,进行地理位置的建模和知识挖掘,包括地理位置的建模识别、主题特征发现和观点挖掘及情感分析。挖掘的地理位置知识可用于地理位置识别、可视化和探索发现等应用。  用户理解。为有效地满足用户对所需信息的获取,除了多媒体内容语义分析,还需要对用户建模分析,理解用户的兴趣分布和意图。这一研究方向以用户为中心,利用用户产生的大量的媒体内容数据和丰富的用户网络行为数据进行用户分析建模,获取用户的特征信息及行为模式。具体的研究问题包括用户属性推断和用户影响力建模。  用户与地理位置结合的建模分析。从地理社会媒体数据挖掘得到的地理位置和用户的知识,需要通过有价值的应用送达给终端用户,满足用户的需求。这一方向把用户、地理位置、地理社会媒体数据在一个框架内进行建模,挖掘融入地理位置和用户的知识,建立推送机制,为用户提供探索发现服务。  围绕上述三个方面,论文的具体工作和贡献有:  1.基于地理属性的地理位置识别。提出一种基于区域隐式支持向量机模型框架来挖掘一个地理区域中具有代表性和判别性的地理属性帮助进行地理位置识别。此外,对挖掘的地理属性做了语义解释,可用于地理位置探索服务。  2.多主题的地理位置可视化。提出一种系统性的可视化方法框架来自动地发现一个地理区域中的地理兴趣点与语义主题进行地理区域可视化。  3.地理实体的多模态主题特征观点挖掘与情感分析。提出一种概率图模型来利用实体的多源媒体数据自动挖掘出实体的多模态主题特征与对应的观点,这样有效地丰富了地理实体的知识图谱维度。此外,对挖掘的观点做了情感分析,并联合主题特征观点,进行了实体关联可视化。由挖掘的多模态主题特征与观点,设计实现了检索任务的应用。  4.关联性用户属性推断。系统性地研究了六种用户属性:性别、年龄、情感状况、职业、兴趣、情绪倾向。提出一种关联性隐式支持向量机模型框架并利用用户产生的媒体内容特征和属性关系进行用户属性推断。提出的模型框架可以用于用户画像和基于属性的用户检索。  5.主题敏感影响者的挖掘。提出一种基于超图学习的方法框架并利用社会媒体网络中用户产生的媒体内容与链接关系挖掘主题敏感影响者。挖掘的主题敏感影响者可用于好友推荐和媒体信息推送服务。  6.场景化个性化的地理位置推荐系统。针对用户在移动场景下的地理位置评分行为的特性,提出一种场景感知回归混合模型对时空场景信息、用户兴趣、地理区域偏好、地理物品与内容进行统一建模并实现推荐。联合提出的模型,提出了一种用户意图和地理位置感知的概率矩阵分解模型,可以融入地理位置与用户的知识,有效地缓解了数据稀疏性问题从而提高了推荐性能,促使用户能够进行当地和新地点的探索发现。
其他文献
该文结合工程实践,探讨了将地理信息系统应用于供水管网管理系统和收费站监控系统时涉及到的一些技术问题.在供水管网管理系统的应用中,该文分析了使用Arc/Info大型地理信息
仿生波动鳍推进水下航行器在低速场合中具有机动性高、稳定性好、抗干扰能力强、噪声低、对环境扰动小等优点,在海洋生物观察、海底管线检修、水下资源勘探、水下捞救等民用领
该文对神经网络在信道编译码中的应用进行研究.在传统编码理论和神经网络理论的基础上,该文作了以下工作:①分析了Hamming译码网络,提出了一种改进模型;②研究了线性分组码的
该文利用目前最为先进的互高阶谱估计方法对多个正弦谐波信号的相位差进行估计,达到了很好的效果.该论文主要开展的研究工作和主要结论如下:首先分析了现有的取样积分和互相
由于图像信息要占用大量的存储空间,所以图像数据压缩技术是图像的存储和传输中不可缺少的关键技术,而医学图像的数据压缩则是医疗档案的计算机管理和计算机远程医疗中的关键技
本文针对目前电力系统中采用电磁式电流互感器测量和监控大电流时所存在的有关问题,研究设计了一种微分光纤干涉式高压电流传感器。与基于法拉第磁光效应以及混合型光纤电流传
该文主要CIMS的故障诊断软件工具的故障焦方法库.该文首先综述了故障诊断技术的发展,分析了已有的各种故障诊断算法,拽出当前算法都只能适应某种或某类情况,提出了建立故障方
该论文在石油大学(北京)自动化所现有先进控制算法和软件的基础上,对先进控制平台进行了开发和相关工程化研究.在先进控制软件平台的开发过程中,首先用软件工程和方法对开发
该论文对当前智能建筑系统集成的现代进行了全面调研,对楼宇自动化系统集成的基本方案进行了较全面的研究,首次开发了一种用于智能建筑的通用型直接数字控制器(DDC),提出了以
该文研究的背景是三峡水利枢纽二期工程中大坝坝体的浇筑工程.混凝土生产运输和浇筑过程是由众多的设备组成的一个复杂的大型系统.为确保浇筑工作能够按期保质完工,设计与实