基于网络表示学习的社交网络分类系统

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kms2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全球信息化加速,互联网改变了人们的生活方式,在线社交网络取代了传统的交互方式,越来越多的用户倾向于使用社交软件进行即时通讯、信息共享、热点讨论等行为。然而,在线社交网络是一把双刃剑,它在提供用户便利的同时,却也悄无声息地泄漏着用户的隐私。在线社交网络的发展滋生了用户展示自身的欲望,用户热衷于在社交软件中分享动态信息,无论是心情随笔还是出行动态,他们渴望同社交好友进行交流互动。用户的不同动态都有其对应的受众,但是数据信息并不会自动识别相应的对象,这导致了用户发布的动态往往在不同的群体中转播,脱离了隐私的相对范围性,导致了隐私信息的泄漏。因此,社交网络分类不仅能为用户在动态分享时提供便利,还能将信息分享限定在用户意图的范围内,有效保护用户隐私。本文从隐私保护的角度提出了社交网络自动分类问题,针对微信社交平台研究了社交网络自动分类方案。并从网络表示学习入手,结合自然语言处理的方式,将社交网络用户分类问题转化为词向量分类问题,在向量空间上实现聚类的目的。论文的主要贡献如下:(1)研究了在线社交网络运行模式、用户行为方式和用户的隐私保护需求,从用户隐私保护的角度提出了社交网络自动分类问题,以及根据动态内容自动在限定范围内发布的问题。(2)提出了用于量化在线社交网络好友关系的亲密度量化模型,并给出了一种获取好友关系权值列表的方法。具体来说,我们分析了在线社交网络的发展现状和用户在社交软件中的交互方式,例如微博中的“点赞”、“转发”和“评论”,以及微信朋友圈中的“点赞”和“评论”等。据此将社交网络中的亲密度关系划分为五类,统计不同亲密度关系好友间的互动行为,并通过社会调查的方式获得不同亲密度关系对应的具体权重数值。将所有互动方式的占比作为支持向量机的输入,权重数值作为输出,训练了一个高精度的亲密度关系分类器用于亲密度的分类。基于采集到的用户朋友圈中的互动信息,利用该分类器将好友间关系归类到相应的类别,从而得到所有好友亲密度关系对应的量化权重,获得好友关系权值列表。(3)基于所提出的好友关系权值列表,给出了一种高精度的社交网络分类算法。具体来说,首先利用Node2vec算法的二阶随机游走方式采集好友关系权值列表中的数据,得到好友节点序列集合,并将节点序列集合作为自然语言处理算法的输入,得到节点的词向量表示形式,即用户的社交好友的数字表示形式;进一步利用手肘法寻找词向量集合的最佳聚类数,并通过K-means聚类算法将词向量聚类,从而实现社交网络好友的自动分类。最后,在实验结果评估模块,利用PCA降维得到社交网络好友分类在二维平面上的可视化效果;紧接着定义了分类精度来阐述好友分类效果,并提出了误差处理方式更新分类结果,证明了本文所提出的算法能够将社交好友高精度地分类,实现了在线社交网络分类系统。
其他文献
在实际应用中,桥式起重机通常受到系统参数不确定性的影响。例如不确定的有效载荷量、缆绳长度、摩擦力还有外部的干扰比如空气阻力等。现在大部分的起重机控制都是将有效荷载的摆动视作单摆摆动。然而,实际中很多类型的起重机和有效载荷构成的是双摆动力学摆动。双摆效应会导致大多数的起重机无法正常工作。因此,本文要研究的是一个关于双摆弱耗散的混合系统。我们主要讨论的是双摆弱耗散混合系统周期解的存在性问题。当非齐次项
切伦科夫断层成像也就是重建光源的实际问题,对应了漫射方程的逆问题。研究切伦科夫光辐射满足的传输方程能从理论的角度达到以较低的成本提高成像的质量与速度的目的。基于课题组之前提出的切伦科夫光成像的随机偏微分方程数学模型,本文将该模型简化为一维空间,将Robin边界条件简化为狄利克雷边界条件。本文的重点是探索简化方程初值的近似数值解的求解思路,为后续课题组的成像打下基础。根据方程中随机项的系数是否和函数
地球长期自然演化和人类活动形成的全球变化和宏观地球科学现象正成为各国和科技界日益关注的方向之一。目前传统的星—机—地遥感平台对地观测技术存在观测周期长、观测角度
流形的微分同胚分类是流形理论当中的核心问题之一。1957年,Milnor关于7维怪球的工作,打破了人们对一个拓扑流形至多只有一个微分结构的认识,具有里程碑意义。在介绍Milnor工作之后,我们简要地介绍了以Milnor工作为基础的关于高连通流形的分类结果。在这些结果的启发下,我们解决了15维高连通流形在欧拉示性类为0的情况下的分类。本文第一章阐述了在流形上微分结构分类的研究背景和意义,以及本文的结
随着深度学习技术的不断发展,对特定目标检测的准确性和检测速度都得到了极大的提升,用于军事侦测的目标检测技术也逐渐落地。迷彩作为一种伪装手段常用于保护己方作战单位,它能够使伪装目标的反射光波同周围景物发射的光波相似,从而达到迷惑敌人的效果。在卫星可见光图像中,使用了迷彩的目标是否可以影响目标检测的检测结果是一个值得研究的安全问题。本文收集相关的卫星可见光图像数据,使用最新的目标检测技术,对迷彩目标进
由于现有的很多程序都是由内存操作不安全的语言编写而成,比如C或C++语言,从而容易受到基于内存安全的攻击。例如,攻击者可以利用一个缓冲区溢出漏洞,覆盖并篡改内存中的某个函数返回地址或程序分支变量数据,从而改变程序的执行流程,影响程序的运行结果。为了应对现有攻击,近年来,业界研究人员提出了许多保护机制来抵御基于内存安全的攻击。然而,经过分析发现,大多数现存的保护机制都是针对程序的控制数据提供保护,比
目前,癌症已成为威胁人类公共健康的世界性难题,传统的治疗方法存在许多的缺点,为克服这些缺点,寻找一种更为智能、安全的癌症治疗方法是十分必要的。近年来,纳米载体靶向递送抗肿瘤药物在肿瘤的治疗方面受到了广泛关注。氧化石墨烯(GO)具有优良的生物相容性、强亲水性、高比表面积,且表面富含各种活性基团,易于进行共价修饰或非共价修饰,因而氧化石墨烯在生物医学领域有着很大的应用潜力。但是未经修饰的氧化石墨烯在生
近年来,随着金融应用、传感器网络等领域的迅速发展,新的数据每分每秒都在产生。为了从海量的新数据中持续实时地获取分析结果,许多大型互联网公司采用流计算来处理数据。作为流计算的底层通信主干,分布式消息系统被广泛采用。随着数据量不断增大,分布式消息系统的性能问题逐渐暴露出来。为了更好地支持不同的应用场景,分布式消息系统提供了大量可供配置的参数。但是,对于大多数用户来说,如何配置这些参数来提高分布式消息系
目的:黄豆苷元能够有效的治疗多重心血管疾病。然而,由于其极难溶于水和油的性质导致了它的口服生物利用度也很低。从而限制了它的口服应用。为了提高黄豆苷元的溶解性质,我们选择制备黄豆苷元纳米混悬剂,接着通过冷冻干燥并装填入胶囊进一步提高制剂的稳定性。方法:本课题用高压均质法和沉淀法结合高压均质法两种方法来制备黄豆苷元纳米混悬剂,正交实验用于处方筛选和优化,通过考察粒径和多分散指数来评价制剂的性质。再将黄
钢悬链式立管是海洋油气开采的关键设备,通过柔性接头为立管和平台之间提供一种承压连接,通过锚固的方式把立管底部固定在海床井口。立管顶端受平台振动运动和海洋环境荷载的作用产生高应力循环而发生疲劳损伤,同时引起立管与海床土的往复运动,使得立管触地区成为疲劳破坏的高发区。因此本文以在管土耦合作用下钢悬链式立管与浮体的整体分析作为主要的研究对象进行数值模拟研究。首先,以钢悬链式立管与浮式平台分析模型为重点研