社交网络用户身份特征识别的虚实映射方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:KFC8525825
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,社交网络已经成为人们生活中不可分割的一部分,是人们获取信息、交友的主要媒体。随着社交网络不断发展,其自身虚拟性、匿名性等特点使之成为一把双刃剑,在给人们带来便利的同时也成为造谣者违法犯罪的新渠道。造谣者躲在虚拟的身份背后在网络上进行传播谣言、诈骗、侵害他人名誉等犯罪行为,严重扰乱了网络秩序,危害其他用户的合法权益。需要一种能有效识别用户身份的方法来维护网络环境的和谐发展。  目前,针对社交网络中用户身份识别的研究主要是通过社交网络用户公开的信息推测用户群体的信息或倾向。上述方法主要是挖掘用户的特征属性对用户群体进行分类,在用户属性的识别粒度不够细,难以推测个体用户真实身份;没有充分利用社交网络的社交关系结构化数据推测用户的特征属性。因此,本文开展社交网络用户身份特征识别的虚实映射方法研究,建立社交网络用户真实身份和虚拟身份之间的映射。定义了用户身份特征、包含当前用户的完全子图、多度传递完全子图等概念,创新性地提出三种社交网络用户身份特征识别方法,并通过融合三种方法的结果推测用户真实身份,设计了方法的整体流程。在收集的新浪微博1.2亿用户数据中随机选择两组随机样本数为1000和10000的信息已知的微博认证用户作为实验数据集进行实验,结果表明本方法具有较高的准确率和覆盖率,有较好的应用价值。论文的主要贡献包括以下几个方面:  1.提出了一种基于地理位置的社交网络用户身份特征识别方法  基于地理位置的社交网络用户身份特征识别方法通过用户地理位置推测当前用户的地址信息和实体信息。方法利用社交网络用户频繁的经纬度地理位置和签到信息获得实体列表;结合博文内容分析计算近似度权重,衡量实体为用户所属实体的可能性;最后通过实体名称聚合算法,对近似度权重计算结果进行优化。实验结果表明所提方法能有效利用地理位置信息细粒度推测用户身份特征。  2.提出了一种基于社交关系的多数投票身份特征识别方法  基于社交关系的多数投票身份特征识别方法利用社交网络的同质性,通过分析与被推测用户具有互粉关系的用户属性,识别用户的未知身份,推测用户的地址信息、实体信息和用户兴趣。定义了用户属性识别分类器,对被推测用户的互粉属性特征进行分类,将分类结果输出给多数投票计数器进行计数统计。实验结果表明所提方法有广泛的适用范围和较高的准确率。  3.提出了一种基于完全子图的身份特征识别方法  基于完全子图的身份特征识别方法根据“三度影响力”原则,构建推测模型,通过分析社交关系结构图中构成完全子图的用户属性,推测团内用户的三度互粉的未知身份。提出了包含推测用户的完全子图身份特征识别方法和多度传递的完全子图身份特征识别方法,利用被推测用户的三度互粉构成的社交网络拓扑结构图的邻接矩阵搜索完全子图,通过多数投票器方法进行推测,有效改善了社交关系稀疏导致用户身份特征识别结果不稳定问题。实验结果表明所提方法具有较高的准确率。
其他文献
在现今全球化时期,人们对翻译的需求越来越大,机器翻译技术飞速发展。如何准确、快速地评价翻译系统性能,已成为影响机器翻译发展的一个关键因素,对机器翻译的研究有着非常重要的
互联网已从创建之初面向点到点通信的网络,发展成一个为全球各行各业提供高效海量信息传输和其它信息服务的庞大网络体系,在整个社会经济生活中起着至关重要的作用。不断出现的
当前,分布式共享与协同技术在汇集和共享地理上分布的空间数据资源,并对其进行一体化组织、存储、管理、访问等方面发挥着越来越重要的作用。在分布式环境中,数据和查询请求在时
业务是通信网络发展的驱动力,随着网络与通信技术的迅猛发展,VoIP(Voice over Internet Protocol,互联网协议电话)单纯的语音业务已经不能满足人们的通信需要。开发更多的业
随着通信技术的不断发展和社会需求的增大,软件定义无线电(Software DefinedRadio,SDR)技术这几年迅速发展,它打破了设备的通信功能的实现仅仅依赖于硬件发展的格局,让设备适用于
随着信息技术的发展,计算机网络深入到生活得各个方面,计算机网络上的应用纷繁多样。当互联网上拥有庞大的信息量与庞大的用户量的同时,信息与用户需求的匹配成为严峻的问题。庞
近年来人工智能技术在图像识别、自然语言处理、决策推理等领域取得了令人瞩目的应用成果,而深度学习技术是推动人工智能发展的重要手段。但与此同时,深度学习对计算能力要求
在托卡马克核聚变反应中,等离子体能否长时间维持放电状态很大程度上取决于真空环境。作为对内真空压强和等离子体密度反馈控制起重要作用的压电晶体阀(PEV)的电源控制是一个
互连网络结构和互连芯片在高性能计算机系统中起着重要作用,是决定整体系统的性能、扩展性、成本的关键因素之一。然而单芯片互连芯片设计与实现日趋复杂,其可扩展性也受到了芯
微粒群优化算法(Particle Swarm Optimization,PSO)是基于模拟鸟群觅食行为而提出的一种新型的群体智能算法,它通过个体间的相互协作和竞争来实现全局搜索。微粒群优化算法的最大