基于移动通话数据的用户行为可视分析推测研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:blackboy1221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据2021年《全球移动市场报告》调查所示,2021年全球的手机用户达到了39亿。大量的手机用户,产生了大规模的通信数据;主要包括网络接入数据、呼叫详情记录(Call Detail Record,CDR)等。其中CDR数据中包含了用户的时间和空间信息。这些为研究城市中公民的移动行为分析提供了基础。但是CDR数据有着规模大、时间跨度长、离散程度大等特点,很难直接进行研究分析。可视分析技术可以将数据映射为各种图表,通过视觉通道对数据有清楚的理解,并且可以通过交互式的方法进行探索分析。自然语言处理(Natural Language Processing,NLP)与深度学习(Deep Learning,DL)等技术可以对数据进行挖掘和预测,从而发现数据的潜在信息。因此,本文结合自然语言处理、可视分析技术以及深度学习技术,从CDR数据中提取用户的行为,结合可视分析方法对用户的角色进行分析推测,并且使用深度学习对用户的轨迹进行预测。本文的主要工作内容如下:(1)提出了一种考虑序列顺序基站轨迹嵌入模型和一种用户降维方法。社会角色是指在社会生活中与位置相关联的一套个人行为模式,可以通过对用户行为模式的研究来探索用户的社会角色。但是通话数据规模大,用户量大,用户的行为模式难以捕捉。针对这些问题,本文使用用户通话的基站序列来构建用户的轨迹序列,通过长时间的轨迹序列来发现用户的行为模式,角色相同的用户会表现出相似的轨迹序列。本文基于词嵌入(Word embedding)和位置嵌入(Position embedding)序列数据建模的方法提出了考虑序列顺序的基站嵌入模型Pos-Cell2Vec对基站的语义进行识别。然后提出了一个基于轨迹序列嵌入的用户降维方法,借助高维可视化方式让用户降维结果实现真正意义上的可视化,相似的用户会在低维空间聚集在一起。(2)设计了一个用户角色可视分析系统。针对用户的角色推测分析,本文结合PosCell2Vec模型提出了本文用户角色推测可视分析模型,设计了缩放、动态聚类、时间筛选等交互机制,并且基于多视图协同可视分析技术设计并实现了基于海量通话数据的用户社会角色推测可视分析系统。该系统包含降维图、用户基站访问列表、用户行为甘特图、群体用户时空特征矩阵图以及轨迹热力图等。本文结合真实数据的案例分析结果表明,分析者通过与系统迭代交互,能够有效的结合用户状态序列以及基站语义信息,对用户社会角色(学生、司机和营销人员)进行推测。(3)提出了一种基于CDR数据的用户轨迹预测方法。针对CDR数据规模大,稀疏性强和难以对其轨迹进行分析预测等问题。本文基于深度学习的双向长短期记忆(BiDirectional Long Short-Term Memory,BILSTM)模型,结合注意力机制、用户的上下文特征和门控机制构建了自适应轨迹预测网络(Adaptive Trajectory Prediction Network,ATPN);并且对用户的轨迹进行预测分析,实验表明,A-TPN在真实的数据集上预测准确率达到94.76%,比传统的马尔可夫统计算法提升8.7%,本文通过丰富的对比实验和分析证明了A-TPN算法的有效性。
其他文献
交通轨迹是交通工具在时间区间内的空间移动路径,反应交通工具的时空特征。探索交通轨迹数据是分析轨迹数据特征的重要步骤。交通轨迹数据是一种时空数据,具有数据量大、时间跨度长的特点,这使得现有的交通轨迹数据探索方法技术门槛高。交通的随机性使得交通轨迹充满不确定性,这将不利于交通轨迹数据的进一步利用。可视化通过直观的视觉通道传达交通轨迹信息,具有直观高效的特点。因此,通过可视化研究交通轨迹不确定性相关问题
学位
图像生成指计算机通过人工智能领域的相关算法,自主产生和真实图片相近的生成图片。其在计算机视觉领域有着重要的地位,主要用于计算机辅助设计、图像编辑、艺术设计、信息转换等领域。然而,目前多数生成图像的实际使用并不普遍,这主要是因为生成图像的质量较低,与真实图片比有较大的差距,特别是在复杂图片的生成任务中,这个缺陷会进一步放大,这使得生成图片难以投入实际的使用。为了进一步提升生成图片的质量,一套合理的质
学位
图像修复是指将图像缺失内容进行重建的一个过程,其主要手段是通过退化图像中还能够获取到的语义信息、纹理信息、结构信息等进行缺失区域的语义预测、纹理预测、结构预测。最后使填充的结果与图像未丢失部分保持相同的风格,连贯的内容。并且,修复结果需要人眼看起来真实,自然。传统的图像修复方法在解决一些简单的小面积缺失区域图像时,修复结果尚可,但是由于其本身的限制,在修复复杂图像、大面积缺失图像时,往往得不到令人
学位
随着基建技术的发展,越来越多的大型构筑物被投入使用,并且伴随着使用年限的增长及使用过程中的疲劳使用和自然灾害等一系列因素,造成构筑物表面或多或少的会出现一些损伤,传统检测手段往往是利用人工完成,对工人的人身安全有着极大的考验,并且还存在部分大型构筑物的巡检部位人工很难到达,因此现代化、智能化检测方式的需求变得日益迫切。本文以数字图象为基础,研究构筑物表面损伤检测技术,利用深度学习方法实现构筑物表面
学位
近年来,深度学习技术的快速发展为图像处理带来了新的机遇,特别是在图像分割、图像识别、图像理解等方面。图像分割是将图像中边缘、区域等特征提取出来,支撑图像处理下游任务,在学术界和工业界受到广泛关注。全景分割融合了图像分割的语义分割与实例分割结果,在图像深入理解场景,如视频监控、自动驾驶、医学图像诊断等发挥了重要作用。全景分割完成对图中的所有物体的背景进行检测与分割,主要分为特征提取、语义与实例分割、
学位
图表示学习将图中节点从高维、稀疏的网络空间映射到低维、稠密的向量空间,映射过程中保持原始的网络结构并支持图推理。通过图嵌入得到的向量规范性更强,可直接作为下游如节点分类、链接预测或可视化等机器学习任务的输入。图表示学习在链接预测任务上效果良好,但在节点分类任务中表现不佳,这是由于节点类别通常与领域内节点的拓扑结构、重要性特征、属性特征及其类别标签信息密切相关。针对节点分类的图表示学习做了如下研究:
学位
开放关系抽取能在不预设关系词表的情况下,对语料进行灵活的关系抽取,快速对知识进行有效的组织、整理。然而开放关系抽取的语料通常包含大量结构复杂的文本。现有的开放关系抽取方法在抽取这类复杂文本时,效果较差,主要存在如下问题。一是句子结构复杂,难以分析出准确的句法分析结果为开放关系抽取提供数据支持。二是复杂文本中的实体词通常是由多个词语构成的名词短语,识别难度较大。三是复杂文本存在关系重叠的现象,以往的
学位
自从进入21世纪以来,全球变暖一直是人们讨论的热门话题,全球年均气温在十年间仅仅上升0.03℃,正是这个极小数据的出现,使人们对“全球变暖”持怀疑态度。研究全球温度变化需要有长时间的观测数据做支撑,目前主要存在如下问题:一是气候数据搜集面临数据体量大,质量低,技术、勘测等种种困难;二是影响气候属性成分越来越复杂,现有模型难以准确预测气候变化;三是极端天气气温相对整体平均温度差别较大,处理困难,对全
学位
目前大量涉及自动驾驶汽车的事故,表明自动驾驶系统软件仍然存在严重的可靠性和安全性问题,对其进行充分有效的测试具有重要的研究意义。对现有自动驾驶系统测试方法的调研发现,很多测试方法并没有完全覆盖真实的驾驶场景,同时合成测试场景图像质量也有待提高。为此,本文利用深度学习技术合成接近真实的复杂场景图像,应用蜕变测试检测被测试自动驾驶系统的潜在缺陷,以达到有效保障自动驾驶系统软件质量的目标。本文的主要研究
学位
聚类算法是机器学习中最常见的无监督学习算法之一,在现代数据科学中发挥着重要的作用。传统聚类算法的主要任务是根据某些特定的规则将相似度高的数据对象划分到相同的簇。当数据对象的某些属性(例如性别,种族等)需要在每个簇中保持平衡时,传统的聚类算法不再适用,这种聚类任务被称为公平聚类。尽管机器学习界近些年在算法公平性问题上做了大量的研究工作,但是对于聚类算法公平性的认识仍处于起步阶段。针对当前公平聚类研究
学位