位置社交网络中轨迹特征挖缺方法研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:penghong97
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着拥有定位能力的装置越来越轻便和普及(如智能手机和可穿戴式设备),使得用户的位置信息越来越容易被取得。许多社交网络提供用户分享轨迹数据的功能,如旅游轨迹、跑步轨迹、骑车路线和行车轨迹。另外,许多社交网络也提供用户分享位置信息的功能,如签到信息和上传包含位置信息的照片。这些包含地理信息的数据代表着用户的移动行为,如果能从这些数据中挖掘出用户的轨迹特征,则可以在社交平台上提供更多和地理相关的个性化服务。本文针对位置社交网络上不同的应用和服务所对应的不同类型的轨迹,提出了不同的挖掘用户轨迹模式的技术。不同类型的轨迹的特征具有显著的差异,为了解决该问题,本文分析了用户轨迹并采用它们特有的特征来表示个体的移动行为。本文分别针对三种类型的用户轨迹:1)被动记录的轨迹;2)主动记录的轨迹;3)主动记录的包含支持数据的轨迹,进行了以下三个方面的研究:在第一个研究主题中,本文提出了从用户被动记录的轨迹数据中发现有类似移动行为的用户社群问题。发现基于移动行为的社群,不仅能够为用户快速找到有相似移动行为的其他用户,还能在社交网络上提供基于移动行为的个性化服务,譬如用户推荐,轨迹推荐等。本文提出了一个解决该问题的框架:1)构建用户移动档案;2)计算移动档案之间的相似度;3)发现基于移动的用户社群。首先,本文设计了转移概率树TP-Tree(Transition Probability Tree)表示用户的移动档案,转移概率树是一个紧凑型的树形结构,不仅包含了用户轨迹中的序列模式,还包含了用户了下一步移动的转移概率。同时,针对不同类型的移动轨迹,本文提出了两种生成转移概率树的算法,深度优先和广度优先方法,能够高效地为用户生成转移概率树。接着,本文针对转移概率树结构,提出了相似度计算方法,充分考虑了树形结构中的所有信息。最后,基于用户移动档案之间的相似度,本文采用了图结构来组织用户和他们之间的相似度,并基于图结构提出了一个衡量聚类结果好坏的目标函数,采用了一个使得目标函数最小化的基于贪心算法的移动社群挖掘算法,发现基于移动的用户社群。实验结果表明,本文提出的转移概率树结构,基于转移概率树结构的相似度计算方法和社群挖掘算法,能够有效地发现基于移动的用户社群。在第二个研究主题中,本文提出了通过病毒营销的方式对社交网站中的指定位置进行推广问题。本文将该位置推广问题转换成社交网络中的影响力最大化问题来求解:通过用户的主动记录轨迹签到记录找到种子用户,让种子用户在目标位置签到,影响他们的朋友前来目标位置签到,进而影响更多人在目标位置签到,使得到访目标位置的用户数量最大化,达到位置推广的目的。首先,本文扩展了独立级联模型到位置感知独立级联模型来作为基于位置的社交网络(LBSN,Location-Based Social Networks)中的传播模型。接着,在计算传播概率时,本文认为用户的移动和签到行为由用户的移动偏好决定,所以本文提出了基于高斯的移动模型和基于距离的移动模型来捕获用户的移动偏好,并基于该移动模型来计算LBSN中的传播概率。获得传播模型和传播概率之后,采用已有的近似方法对影响力最大化问题求解,得到种子用户,让种子用户在目标位置签到进行位置推广,使得到目标位置签到的用户数量最大化。实验结果表明,本文提出的位置感知独立级联模型,基于距离的移动模型计算传播概率的方法,能够更精确地反映LBSN中的信息传播和扩散,进而能够有效地采用病毒营销的方式对LBSN中的位置进行推广。在第三个研究主题中,本文提出通过用户主动记录的包含支持数据(用户活动类别)的签到记录,对用户在特定时间特定位置的活动和用户在特定时间特定活动的移动区域进行推断问题,简称为用户活动和移动推断问题。针对该问题,首先,本文采用了贝叶斯网络对签到记录中的时间,位置和活动进行建模,并分别对用户的活动推断和移动推断问题进行简化。简化后的活动和移动推断问题中包含两个部分:时间和活动的关系,位置和活动的关系。接着,本文提出了下一步活动转移概率模型来为时间和活动建模。本文采用了高斯混合模型来为不同的活动中的活动和位置建模。最后,基于上述两个部分的结果,计算LBSN中用户的活动推断和移动推断。实验结果表明,本文提出的基于贝叶斯的方法,能够有效地对用户的活动和移动进行推断。综上所述,本文的研究专注于从不同类型的用户轨迹数据中挖掘用户移动行为,为不同的基于位置的个性化应用和服务提供支持,具有重要的理论和实践贡献。本文主要的创新贡献主要有:第一,本文提出了转移概率树结构从被动记录的用户轨迹中捕获用户移动档案,不仅包含用户轨迹中的序列模式,还包含序列模式的下一步转移概率。能够有效反映用户轨迹中的特征,为发现基于移动的用户社群提供了良好的数据结构支持。第二,本文采用病毒营销的方式对LBSN中的位置进行推广,其中计算传播概率的方法中,提出基于距离的移动模型为用户的签到行为建模,并基于该移动模型计算LBSN中的传播概率。计算出的传播概率更精确地反映了LBSN中的信息传播和扩散,为LBSN中的传播概率计算提供了新思路。第三,本文采用基于贝叶斯的方法对用户活动和移动推断问题进行简化,提出了下一步活动转移概率为用户的活动-时间关系建模,采用了高斯混合模型为用户位置-活动关系建模,进而得出用户的活动和移动推断结果。为LBSN中的个性化服务提供了更精确有力的技术支持。本文的主旨就是从不同类型的轨迹类型中,为不同的应用挖掘出不同的用户移动特性。三个研究主题分别从被动记录轨迹,主动记录轨迹和包含支持数据的主动记录轨迹中挖掘出用户移动行为,找到具有移动相似性的用户社群,计算LBSN中的传播概率,对用户的活动和移动进行推断,为位置社交网络的个性化服务应用提供支持。
其他文献
当前复杂严峻的经济形势对中国参与全球价值链生产提出了挑战。过去30年,全球价值链是推动全球经济增长,经济全球化的重要推手。改革开放以后,中国凭借劳动力禀赋优势,通过发展加工贸易嵌入全球分工体系,极大地促进了对外贸易增长(文东伟和冼国明,2009)。如今外部环境复杂多变,我们要构建“以国内大循环为主体,国内国际双循环相互促进”的新发展格局,三大政策支柱之一便是要素流动与区域一体化,价值链向本土化和区
学位
以人工智能技术优化教学服务形态已成为“人工智能+教育”的新趋势,课堂教师行为的反馈作为教学过程评价的一种服务,是教师提高教学能力的重要渠道,教师行为分析的目的是挖掘行为数据背后有价值的信息,最终促进教师对于教学过程、教学结果以及教学环境的优化。教师行为提取与识别是教师行为分析的第一步。然而,目前基于视频的教师行为提取与识别仍普遍采用半自动方式,固定时间分割视频场景后过于依赖于分析人员的主观经验,无
学位
人类从来没有摆脱过贫困问题的困扰。进入21世纪后,人类的贫困问题不是减弱了而是严峻了,尤其是在人类经历了2008年世界经济危机后,贫困问题更加严峻,它不仅是落后国家和地区的严重问题,即便是发达国家也仍然存在着严重的贫困问题,这种现象被称为丰裕社会的贫困。这些情况足以表明,当今世界贫困问题仍是一个全球性的大问题。严峻的贫困现实已导致了贫富两极分化的加剧,在国际上我们称作南北差距,南北差距的加大直接影
学位
本文旨在研究国际智囊以往的研究和报告中关于“一带一路”倡议的论述。研究详细阐述了中国-阿拉伯及中国-黎巴嫩自建交以来的关系,在研究结尾作者为促进“一带一路”倡议在阿拉伯地区正常运作并成功执行签订项目提出了一些建议。作者指出,这一倡议是增强中国在阿拉伯地区的影响力的有效工具,并为与阿拉伯人建立伙伴关系奠定了坚实的基础。黎巴嫩作为阿拉伯世界参与到“一带一路”倡议中的一份子,将受益良多。一带一路”(OB
学位
汇率变动对于实体经济的影响一直是学术界和政策界关心的重要问题。2005年7月中国人民银行宣布开启人民币汇率改革之后,人民币汇率进入了一段较长的升值通道。同时学界也涌现了许多关于人民币汇率变动对中国经济影响的相关研究。众多文献从经济增长、金融监管、国际贸易、国际资本流动等角度研究了汇率变动的宏观效应,但是这些都难以揭示汇率变动带来的微观成效。因此,越来越多的学者开始探索汇率对微观经济主体经营绩效的影
学位
政治认同是在特定的经济基础上,主体对所处社会环境中一定的政治对象所产生的肯定性、同一性、归属性的心理状态和实践活动的总和,它在实现社会成员个人价值和身份认同、建构政治权力的合法性基础、维护国家的统一稳定等方面发挥着不可替代的重要作用。习近平总书记多次指出,人心向背、力量对比是决定党和人民事业成败的关键。人心是最大的政治,认同是最强的力量,提升民众政治认同是新时代中国政治建设的重大任务。我国正处于转
学位
MOOCs近年来发展迅速,它是新兴信息技术和教育深度融合的颠覆性创新,为公众提高能力提供了多元化的学习方式,使学习者足不出户就可以拓展国际化视野,进一步推动全民学习和终身学习。伴随着MOOCs平台蓬勃发展,MOOCs学习者辍学率高,大量学习者没有完成课程,这种现象开始受到业界质疑和诟病,也引起学术界关注。虽然低完成率、低保持率指标与传统教育评价更为相关,并不适合以此指标评估MOOCs学习效果,但低
学位
首例信息型市场操纵的刑事案件——“徐翔案”于2017年判决,具有里程碑意义。与传统的短线操纵不同,信息型市场操纵涉及上市公司(实体经济)与二级市场机构(资本市场)的联合操纵,操纵者利用信息发布与传播、配合公司行动和连续交易,联合操纵股价,炒作持续性更长、影响范围更广,更容易引发股价巨振、诱导大量资金跟风交易,因而更有可能发生财富的转移。特别是在减持前人为发布和传播利好信息,配合公司行动和连续交易抬
学位
自动问答在计算机科学中占有重要地位,也是信息检索和自然语言处理领域的重要研究方向。与搜索引擎仅简单检索排序文档不同,自动问答系统提供的是更加具有语义内涵的自然语言表述。自动问答的主要任务是理解并自动回答用户提出的问题,并构建满足用户检索和推理需求的自动问题回答系统。作为一种精确的检索技术,开放域问答技术旨在为人们提供更自然、直接的信息访问交互界面。开放域问答是指不限定在一个特定领域中进行的问答,它
学位
在行为金融理论框架下,金融异象即资产定价异常是由投资者的行为造成的,但投资者行为并不是固定的,而是会随着投资者类型以及投资者所在市场的不同而有所差异。各类投资者在不同市场下的行为是怎样的?投资者情绪和异质信念、资金约束等因素是如何影响投资者行为,是否会造成资产的定价异常?为了解答这些问题,本文主要聚焦于三类典型的投资群体,选择了套期保值者、典型的投机者——内幕交易者、不同市场之间的套利者,围绕不同
学位