基于连续时空签到的跨社交平台用户身份匹配研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tdsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基于位置的社交网络平台的发展,产生的大量含有时空信息的签到数据给用户行为特征研究带来了新机遇。作为最具代表性的研究之一,跨社交平台用户身份匹配推动了用户跨域信息融合,促进了更优质的商业服务和个性化推荐质量,因此引起了广泛的研究关注。然而,在处理时空签到数据时,现有工作大都使用离散化方法,忽略了时空本身的连续性,导致严重的边界效应,影响算法性能。为了解决该问题,本文提出了基于关联位置连续签到模式的用户身份匹配算法CP-Link。该算法根据用户空间访问区域的密度分布特点,基于密度峰值聚类方法将用户时空签到划分为符合其行为特征的连续停留区域,区域间相似度根据连续性的动态时间规整计算得出。同时,时空签到信息普遍存在着数据稀疏的挑战,本文提出了基于关联用户的位置频繁模式挖掘模型获取潜在的签到数据,弥补稀疏的签到记录。实验表明,CP-Link的AUC性能指标在现有算法基础上提高了20%,具有较强鲁棒性,并且当关联挖掘模型被攻击时能保持稳定的性能。同时,CP-Link在隐私保护算法防御下依然能有效匹配用户。进一步研究表明,除总体数据稀疏外,部分用户的时空数据还普遍存在较为严重的稀缺特性,即数据量极少的用户占比大,导致算法无法正确匹配到这些数据量极少的用户。本文探索了网络社交关系特性对于跨平台用户身份匹配的增强作用,并提出跨域自我中心网络(Cross Domain Ego-network)轨迹匹配算法Ego MUIL。该方法捕获了社交网络拓扑结构特征,并融合了用户本身及其密切相关用户的时空签到数据。本文将这些特征都集成到一个动态超图中,通过图卷积网络学习用户的向量表示,因此弥补了数据的稀缺性,提升了用户行为描述的唯一性。实验表明Ego MUIL算法在在准确度指标上比现有最先进算法高出30%,在数据稀缺的情况下依旧发挥稳定良好的性能,这也体现了算法的鲁棒性。CP-Link和Ego MUIL的提出极大地促进了整体数据稀疏和局部数据稀缺时的匹配性能,为未来的相关研究提供了新的解决思路。
其他文献
随着人口老龄化的加剧,对老人的安全监护逐渐成为社会的重要课题,意外跌倒是导致老人意外死亡的重要原因,若能够及时地检测出跌倒的行为,对挽救老人的生命有很大帮助。由于姿态估计提取到的人体骨架特征可以很好地编码人体的结构信息,能够帮助实现高效的跌倒检测算法。因此,本文首先对人体姿态估计的相关技术展开研究,再基于姿态估计设计一个轻量高效的跌倒检测算法,主要内容如下:(1)在姿态估计领域中,热图被广泛用于编
学位
随着5G时代的到来,为无线通信网络中数以亿计的新接入设备提供高速、稳定的服务,成为了无线网络最迫切的需求。由于其能耗较低、易于部署、适用性强的优势,智能反射面(Intelligent Reflecting Surface,IRS)在无线通信系统优化问题中得到了广泛研究。然而,现有研究往往忽视了IRS本身的供能需求。受到无线能量传输技术的启发,本文引入无线射频能量收集技术解决实际应用场景中的IRS供
学位
近几年来,随着人工智能技术的不断发展,人工智能现实应用场景中存在的数据孤岛和数据隐私保护问题不断暴露出来。联邦学习作为一种解决数据孤岛和数据隐私保护问题的有效解决方案,受到了广泛关注,并且在多个领域有了成功的应用。然而,联邦学习的现实应用场景中普遍存在的数据异构性问题限制着联邦学习的发展,成为联邦学习落地的阻碍。解决联邦学习数据异构性问题成为联邦学习的关键挑战。现有的联邦学习数据异构性解决方案的关
学位
最近,研究者发现深度神经网络很容易受到对抗样本的影响,后者通过在正常样本上添加一些人眼难以察觉的微小扰动,能使神经网络对其错误分类。研究表明,部分对抗样本具有转移性,这使得攻击者在本地的源模型上制作的对抗样本可以威胁目标模型。因此,研究这类攻击方法对评估和提升深度神经网络的健壮性意义重大。传统转移攻击方法使用固定的源模型组合(称为集成模型),对正常样本(称为原始样本)迭代修改。由于计算资源有限,攻
学位
随着互联网技术的快速发展与全面普及,网络中的信息以惊人的速度产生和传递,“信息爆炸”的时代已经来临。推荐系统作为信息过滤的重要手段能够有效地缓解信息过载带来的消极影响,推荐系统在不断提高用户体验的同时带来了丰厚的经济效益,其重要性也日益凸显,越来越多的研究工作专注于推荐系统中的安全性问题。推荐系统中的投毒攻击可以通过虚假欺骗数据的注入来实现操纵推荐系统的目的,这种投毒攻击严重危害了推荐系统的正常运
学位
近年来,多媒体业务的蓬勃发展带来了网络中视频流量的井喷式增长,互联网用户开始追求更高质量的视频传输业务。随着小型卫星通信组网技术与发射技术日趋成熟,可全球覆盖的低轨道宽带卫星通信网络(低轨道卫星网络),为视频组播带来了新的发展契机。通过在低轨道卫星网络中部署软件定义网络(Software Defined Network,SDN)框架,可以克服地面网络分布式管理瓶颈,实现更高效的软件定义组播(Sof
学位
为保障工业系统的可靠性,尽可能避免因设备运行异常导致的危害,如何高效地检测出设备异常运行状态是一个急迫的问题。大多数异常的发生是一个渐变的过程,因此本文通过检测传感器采集的时间序列片段样本用于判别设备是否处于异常运行状态。基于传统信号处理的检测算法需要针对具体设备做特征工程,不利于应用到不同类型的设备,存在泛化性差的问题。而深度迁移学习能够自动地从不同类型设备数据中提取有用特征,无需依赖过多标注数
学位
随着近年来基于位置的服务(Location-based Services,LBS)的发展,人们对位置隐私保护问题的关注度越来越高。位置和轨迹数据通常会包含用户个人的敏感信息,直接发布会对用户隐私造成威胁。差分隐私(Differential Privacy,DP)作为一种具备坚实数学基础的隐私保护方法,在位置和轨迹数据发布中得到了广泛的应用。然而,现有的位置差分隐私发布机制,大多数只考虑静态场景的位
学位
如今视频传输已占据因特网中绝大多数的带宽,传统的视频组播方式会产生大量的带宽浪费。而新兴的大规模多层低地球轨道(Low Earth Orbit,LEO)卫星网络可以通过星间链路进行带宽优化的视频组播,显著减少流量浪费。目前对于卫星网络组播路由的研究集中在IP组播,但其路由性能和可拓展性有限,并不适用于大规模卫星网络。新兴的软件定义组播(Software Defined Multicast,SDM)
学位
证照作为公民的身份凭证,在金融、交通和医疗等领域都应用广泛。由于人工查验效率低下,难以适应日益加快的国际化进程,因此亟需实现证照的自动化查验。然而,证照种类繁多,版面结构复杂多样,证照表面印有复杂的背景图案和防伪特征并且常常出现字符污渍和缺损等情况,给现有算法带来了巨大的挑战。针对以上问题,本文提出了一套适用于证照的结构化识别算法。针对证照中细长文本检测困难问题,本文提出了一种分组多路可选择卷积,
学位