面向社交媒体的网络表示学习关键技术研究

来源 :战略支援部队信息工程大学 | 被引量 : 3次 | 上传用户:temp1229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着以Facebook、Twitter、微信和微博为代表的大型社交媒体的快速发展,产生了海量的网络结构数据,如何合理地表示这些数据是实现大规模网络数据高效挖掘的基础。网络表示学习(Network Representation Learning),又称为网络嵌入(Network Embedding),就是为解决这一问题而兴起的研究方向。现有网络表示学习方法主要利用网络结构信息和其他异质信息,采用矩阵分解或神经网络方法训练得到网络节点的低维向量表示。但面对海量、动态、异质的社交媒体数据,现有网络表示学习方法仍存在以下问题与挑战:1)社交媒体中用户种类复杂多样,用户关系交叉重叠,使得现有网络表示学习方法生成的用户表示向量相互混杂、难以区分;2)社交媒体用户间的网络结构动态变化,现有动态网络表示学习方法对用户节点演化过程建模不足;3)社交媒体的不同对象间存在复杂的语义关系,在将网络连边中丰富的语义关系信息融入节点表示上还存在不足;4)社交媒体中用户数据来源多样且包含大量噪声,现有融合异质信息的网络表示学习方法在噪声干扰场景中鲁棒性不强。针对上述问题,本论文依托某装备预研项目和国家自然科学基金项目“针对有向网络的链路预测原理及方法研究”,借助社交媒体网络中丰富的用户数据,对面向社交媒体的网络表示学习关键技术展开研究。主要研究成果如下:1.针对社交媒体中现有静态网络表示学习方法生成的网络节点表示相互混杂、难以区分的问题,提出一种融合节点标签信息的网络表示学习方法。该方法充分利用已有的部分标签信息,并首次引入深度度量学习技术,将网络中不同类别节点间的距离信息融入生成节点表示的模型训练过程中,使得现有表示学习模型增强对全局信息的度量,有效提升了网络表示学习算法在节点分类任务中的准确率。在真实数据集上与现有方法的仿真对比表明:该方法在节点多标签分类任务中准确率平均提升10%左右,在可视化任务中类别划分更加准确。2.针对现有动态网络表示学习方法在社交媒体网络动态演化场景下对网络结构时变信息建模不足的问题,提出一种融合时空变化信息的网络表示学习方法。该方法首先利用动态网络中当前和过去时间内的网络结构,构建用户节点在一定时间窗内的时空轨迹图,实现将用户的时空变化信息嵌入到静态的时空轨迹图中;然后利用重启式随机游走算法,在时空轨迹图中获取节点的随机游走序列;最后利用经典的Skip-gram模型,训练得到动态网络中一定时间窗内用户节点的轨迹表示。在三个真实动态网络数据集上的仿真结果表明:该方法可有效融合节点的时空变化信息,使得训练生成的网络节点表示在节点分类及链路预测任务中准确率提升5%以上。3.针对当前网络表示学习方法在刻画社交媒体网络中丰富连边语义信息不足的问题,提出一种融合连边语义信息的网络表示学习方法。该方法首先基于表征不同语义关系的元路径在网络中进行随机游走,生成不同类型节点组成的节点序列;然后根据节点序列和元路径权重计算方法,筛选出重要元路径,将异质信息网络转化为融合多维语义信息的带权子网络,实现对不同元路径语义信息的融合;最后在抽取的带权子网络中利用Skip-gram模型得到节点向量表示。实验结果表明:该方法可有效筛选重要元路径,生成融合不同元路径语义信息的网络节点表示,在节点分类任务中优于基准算法。4.针对融合异质信息的网络表示学习方法在社交媒体数据存在噪声干扰场景下鲁棒性不强的问题,提出一种基于D-S证据理论的网络表示决策融合方法。现有研究在网络结构的基础上考虑融入多维属性信息来提升网络表示效果,由于信息来源的差异性,多源信息的相互验证可以提升网络表示的性能,但信息冲突也会降低融合效果。本文方法中首先通过SVM算法给出不同属性信息对融合表示结果的支持度,然后利用证据组合规则对各特征的网络表示进行冲突处理与融合评价,并创新地引入混淆矩阵对各类别分类中的局部可信度进行建模,实现对分类算法中后验概率的校正。仿真实验表明:本方法可以有效检测网络表示融合中的冲突,提升网络表示融合效果。最后,本文在上述融合异质信息的网络表示学习研究基础上开展相关应用,提出一种基于网络表示学习的用户行为分析方法和针对用户不同类型数据的编码处理方法。根据所获取网络数据的特点,分别以微博网络和电信网络为代表,开展了基于网络表示学习的微博异常用户检测和电信网用户行为模式挖掘研究。
其他文献
舒曼作为德国音乐史上杰出的代表人物,钢琴套曲《狂欢节》是其诸多钢琴作品中最具代表性的作品之一。他的音乐创作不拘泥于传统风格,敢于创新,所创的钢琴套曲不同于传统的古典钢琴套曲结构原则,用其最擅长的小标题形式,将一组有个性的小曲用统一的主题构思串联起来,创作出了具有舒曼风格的套曲作品,对后世的音乐发展有着巨大的影响。本文共分三章,叙述了舒曼的生平、作品《狂欢节》的创作背景,分析了该作品的曲式结构、和声
近年来,恐怖袭击在国内外频繁发生。传统的安检探测设备仅能探测出金属物品,对隐藏危险物的检测识别通常是由人工完成,不仅费时费力,而且漏检率高。基于太赫兹图像的隐藏危险物检测可穿透衣物,发现藏匿的金属及非金属危险物,且其光子能量较低,具有安全、快速、可靠等优点。本文将机器学习技术用于太赫兹图像隐藏危险物检测与识别,针对太赫兹图像数据集具有的非平衡和小样本等问题,研究了基于深度学习的非平衡小样本异物检测
新《纲要》开宗明义,把“听党指挥、能打胜仗、作风优良”的强军目标作为基层建设的新标准。强军目标是对新时期军队发展方向的战略定位,也是对军队建设全局的顶层谋划,具有统
报纸
舒曼天生有着钢琴小曲的创作天赋,《狂欢节》是她最有代表性的钢琴作品之一,该作品将各种音乐语言的将舒曼的音乐风格完美的表现出来。本文以舒曼创作的钢琴套曲《狂欢节》为
抓基层是部队建设的常态,无论平时还是战时,无论训练还是执勤,无论执行一般任务还是重大任务,都必须按照《军队基层建设纲要》要求抓基层。武警部队养兵千日用兵千日,遂行多样化任
报纸
太极拳是我国优秀民族文化遗产中的一个组成部分,是我国一项传统的体育健身项目。在当前现代化快节奏、多变化的时代背景下由于众多因素的影响下,太极拳如何进一步传承和发展
太极拳乃中国武术之精粹,在它创立的过程囊括了儒、道、佛诸多名家理论,特别是它把刚柔并济、圆柔连贯的优美动作同舒缓柔和的音乐以及深奥的东方哲学紧密地结合起来,充分彰
太极拳作为世界性的品牌在河北省形成产业化具有充分的条件。本文运用文献法、调查法、访谈法、逻辑分析法和头脑风暴法对河北省太极拳产业现状进行调查研究,并提出对河北省太
信息技术作为初中信息课堂教育教学中一项必备的教学科目,创新教育教学方法及模式对于提高学生的学习效率同时提高教学质量是非常重要的。所以,初中信息技术课堂作业凭借体系
帮助自杀行为是给已有自杀意图并实施自杀行为的完全刑事责任能力人以器械或精神鼓励的一种帮助行为。刑法理论界和司法实务中对于帮助自杀行为的法律定性问题一直存在争议,并没有统一的答案。司法实践中多以故意杀人罪对其定罪量刑;有些学者则主张帮助他人自杀有一定的违法性,但不能按照故意杀人的行为进行处理,应对其单独定罪;另有学者则主张帮助自杀无罪说,本文也支持该观点。本文主体分为三个部分,从行为非罪化的理论支撑