跨社交网络用户多重身份识别算法研究

来源 :解放军信息工程大学 | 被引量 : 7次 | 上传用户:2km
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨社交网络用户多重身份识别作为在线社交网络研究的重要组成部分,在网络空间治安管理、个性化服务推荐、社交网络数据挖掘等方面具有重要的意义。当前,跨网络身份识别研究已经取得较大进展,多种身份识别算法相继被提出,但相关研究中仍然存在一些问题:(1)当前基于拓扑结构信息的算法只关注自中心网络拓扑环境,未考虑隐藏的标签节点,而隐藏的标签节点对提高节点的辨识度具有重要作用;(2)目前利用公开档案属性信息进行用户身份识别的算法,在属性项的权重分配上使用主观导向的客观修正法,没有考虑各属性项特殊的含义与作用;(3)基于行为信息的用户识别中,针对用户独特的写作与阅读风格对行为规律建模,但忽略了行为信息在社交网络中动态演变的问题。针对以上问题,本文提出三种身份识别算法,以进一步提高跨社交网络身份识别算法的精准度和通用性,主要研究内容如下:1.提出了一种基于隐藏标签节点挖掘的跨网络用户身份识别算法。该算法首先为待匹配节点增加社团聚类信息,将挖掘出的隐藏标签节点加入到待识别节点的好友网络里,进而通过对潜在的关系信息加以运用,以提升待识别节点的辨识度,然后利用标签节点找寻最佳匹配,最后通过迭代运算完成全网络所有节点的身份识别。多个随机网络与真实社交网络数据集上的实验结果显示,与基于自中心网络的算法相比,所提算法在保证识别准确率的前提下,可以提升召回率与综合性能,从而识别出更多的用户账号。2.提出了一种基于档案属性信息熵权决策的跨网络用户身份识别算法。首先,该算法对不同属性项根据其数据类型及物理含义采用不同的相似度计算方法,进而根据各属性的信息熵值赋予权值,最后融合各个属性判定账号是否匹配。理论分析和实验结果表明,与基于主观导向的客观修正赋权策略的识别算法相比,所提算法具有较好的鲁棒性,在多个社交网络之间识别账号时具有更好的识别性能指标。3.提出一种基于兴趣演变规律分析的跨网络用户身份识别算法。该算法首先通过引入社交网络中用户节点特有的行为类别和网络结构等附加信息,对标准主题模型进行改进,然后将用户的兴趣主题分布按照时间段进行划分,基于整体静态分析与局部动态分析相结合的方式对账号进行匹配。在真实微博类社交网络数据集上的实验结果表明,所提算法中权重改进后的主题模型的困惑度值比标准主题模型更低,与当前具有代表性的基于主题挖掘类身份识别算法相比,所提算法具有更高的身份识别准确率与良好的综合性能。
其他文献
<正>从本文的标题《专题博物馆个性化实现路径探索》,我们可以看出几个关键词:第一个是"专题博物馆"。所谓专题博物馆,是指那些有别于综合性博物馆,仅仅就某一类事物进行收藏
会议
<正>团中央书记处高度重视扶贫工作,以习近平新时代中国特色社会主义思想为指引,深入贯彻习近平总书记关于扶贫工作的重要论述精神,落实中央和国家机关工委的部署安排,发挥团
Sakai是一个开源的网络教学和协作学习的平台,文章以计算机文化基础课程为基础,开展基于Sakai的混合教学模式的研究,探讨了在Sakai网络教学平台上开展混合教学的模式和基本过
碘缺乏与碘过量均可以导致甲状腺疾病,目前临床医生对碘缺乏已经有了明确而统一的认识,但对碘过量仍无统一的认识,主要还是机制不明确。本文欲从国家对碘的认识沿革、碘与甲
<正>《蝙蝠和雷达》的教学难点是让学生弄清蝙蝠的嘴和耳朵的作用,初步了解蝙蝠探路的方法,以及飞机夜间飞行与蝙蝠探路之间的关系。我在教课文《蝙蝠和雷达》时,运用图示板
文章利用加拿大森林模拟和优化模型FSOS,以中国吉林省白河林业局为案例,探讨不同的森林经营管理方案对白河林业局森林碳储存、木材生产和经济效益的影响。结果表明,每年生产
在人民币经历2005年的汇率改革与2016年人民币加入特别提款权,中国进出口贸易经历2009年经济危机与2015年全球经济不景气到近两年中国进出口贸易恢复持续增长的背景下,研究中
以谷胱甘肽为稳定剂水相合成了CdTe量子点,研究了恶霉灵对量子点荧光性能的影响.结果表明恶霉灵可使CdTe量子点的荧光猝灭,且猝灭的强度与恶霉灵的浓度呈正比.在最佳条件下,
2019年是新中国成立70周年,是打好"三大攻坚战"的关键之年。全省水利系统坚决贯彻落实习近平总书记治水系列讲话精神,积极践行新时期治水方针,紧扣水利工程补短板、水利行业
为发展星地一体化网络、真正实现全球无缝覆盖,研究地面移动通信空中接口在卫星通信的适用性是一种有效的解决思路。本文系统性的介绍了地面3G/4G移动通信空中接口和卫星通信