跨社交网络用户身份识别算法研究

来源 :战略支援部队信息工程大学 | 被引量 : 7次 | 上传用户:sophia_deng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线社交网络的迅速发展,越来越多的人在多个社交网络上拥有账号。然而互联网中缺乏一个能够关联人们在各个社交网络中账号的身份标识,导致无法获得完整的用户信息。跨社交网络用身份识别解决的便是此问题,即识别出单一用户在不同社交网络中拥有的多个虚拟账号,其在人物搜索、跨平台推荐系统、用户画像等实际应用中具有重要意义。当前,跨社交网络身份识别算法主要利用社交网络中的网络拓扑结构信息、用户属性信息以及用户行为信息进行身份识别,针对上述三类信息的相关研究虽然取得了一定进展,但仍存在以下不足:(1)当前基于网络拓扑结构的身份识别算法只关注网络中节点间的好友关系,未考虑网络中的节点间非好友关系,而非好友关系对于提升身份识别精度具有重要作用。(2)目前利用用户属性信息进行身份识别的算法,在计算用户档案相似性时,仅仅追求属性值相似,忽视了同一用户在不同时间点拥有不同属性值这一现象,缺乏对用户属性的时变分析。(3)基于用户轨迹的身份识别方法,将用户访问的各个地理位置看作坐标点的集合进行处理,忽略了用户轨迹中各个地理位置的顺序特征。针对以上问题,本文面向社交网络中的网络拓扑结构信息、用户属性信息以及用户轨迹信息,分别提出三种身份识别算法。主要内容如下:1.提出了基于带权超图的用户身份识别算法。首先该算法引入带权超图来表示网络中节点间的好友关系与非好友关系,其次结合身份已知的种子节点,表示待匹配节点所处的拓扑结构,提升了节点间的相似性度量的准确度。最后利用交叉匹配算法,迭代地计算出匹配的节点对。在DBLP网络与真实社交网络上的实验结果表明,所提算法在准确率和召回率方面均有提升。2.提出了基于属性值转移规律的用户身份识别算法。首先该算法对用户属性数据进行统计分析,得到不同属性值随时间发生转移的概率,然后在计算用户档案间相似性时,将属性值转移概率与传统的文本相似性结合,以达到在计算属性信息相似度时,考虑属性值随时间转移的目的。在多社交网络数据集上的实验结果表明,所提算法可以分析出属性值随时间转移的规律,克服了仅仅追求属性值文本相似的缺点,有效提升了身份识别的准确率与综合评价指标。3.提出了基于轨迹信息位置访问顺序特征的用户身份识别算法。首先对用户轨迹进行预处理,将用户轨迹按照一定的时间粒度、距离尺度进行划分,使得用户轨迹中的位置顺序特征易于提取,其次引入paragraph2vec算法中的PV-DM模型,提取用户轨迹中的位置访问顺序特征,利用提取出的特征计算轨迹相似性,实现跨网络的用户轨迹匹配。在真实时空数据集上的实验表明,该方法有效地提升了身份识别的准确率。
其他文献
发展米制品加工业是提高我国稻米生产效益的重要途径。根据不同加工目标确定不同米制品专用稻品种并建立相应的栽培技术体系,对于保障米制品加工质量和促进米制品加工业的健
提出利用电荷耦合元件(CCD)和现场可编程门阵列(FPGA)实现钢轨图像实时采集与预处理,以解决人工检测钢轨效率低、实时性低等问题。在Quartus II中编写钢轨图像采集模块、读写
良渚文化因大量出土种类繁多、制作精美的玉器而闻名于世。由于玉器产地稀少,珍贵难得,加之本身所体现的审美以及宗教方面的精神内涵使其成为了不同于一般的“高级产品”。良
<正>洈水风景区位于湖北省松滋市西南部,地处长江三峡、荆州古城、湖南张家界三个著名旅游区的中心部位,是"三峡-洈水-张家界"这条黄金旅游线上的一颗璀璨明珠。风景区由洈水
<正>中国经济类核心期刊全国中心城市经济运行会工作期刊国家社科类优秀期刊《当代经济》杂志是经国家新闻出版广电总局批准、国家发展与改革委员会经济运行局重点指导,由湖
本文从认知心理学角度简析了英语阅读的认知过程,探讨了阅读中语言和思维的关系,并结合“行为-认知”教学法、大脑风暴法及图式理论就英语阅读课的教学提出了几条建议。 Thi
随着时代的迅猛发展,现实社会对高职院校学生的要求也越来越高.然而,目前的高职院校教育存在的种种问题使其很难满足社会的需要.在教育改革如火如荼的今天,高职院校思政课想
通过盆栽试验,分别设计6个铅(Pb)和镉(Cd)浓度梯度预处理土壤,研究了不同浓度重金属胁迫下芋不同器官中Pb或Cd的富集规律及对生长发育的影响;同时,通过对5个芋产区和4个茭白产
<正>1993年,东城法院未成年人审判庭(简称"少审庭")作为北京市第一个庭级建制的涉少案件审判庭,至今已走过了20个春秋。2013年,东城法院涉少工作再获佳绩,被首都文明委评为"
本文选取胡先骗为对象,以时间为序,考察其在近代历史变迁中的政治取向问题,在分析中主要以胡先骕在国共两党纷争格局中的立场问题为主线,探讨他在时局变迁背景下所作出的政治