利用实体解析的跨社交媒体同一用户识别

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:kevinchen12344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的 /意义]跨领域关联实体一直是实体解析研究的主题,本文旨在不同的社交媒体(跨社交媒体)中找到属于同一用户的账户。[方法/过程]在传统近似字符串匹配技术的基础上,提出使用属性值结合社交媒体中的链接和文本内容的方法,比较两个不同社交媒体账户的属性相似度、邻域相似度和关键词相似度这三个匹配函数,以此提高识别这两个账户是否是同一个人的精确度。并利用社交媒体Facebook和Twitter数据作为实验数据集,针对匹配函数的不同组合进行试验。[结果 /结论]结果表明,三个匹配函数的组合能够得到更多的账户匹配为同一用户,同时精确度也很高,达到0.923。本文提出的方法在Facebook和Twitter上的成功运用,给其他社交媒体平台或者其他领域的实体关联的研究提供了一条新的路径。 [Purpose / Significance] Cross-domain related entities have been the subject of substantive analytic research. This article aims to find accounts belonging to the same user in different social media (social media). [Methods / Processes] Based on the traditional approximate string matching technique, a method of combining attribute values ​​with links and text content in social media is proposed to compare attribute similarity, neighborhood similarity and key of two different social media accounts Word similarity These three matching functions, in order to improve the identification of these two accounts are the same person’s accuracy. Using social media Facebook and Twitter as experimental datasets, different combinations of matching functions were tested. [Results / Conclusions] The results show that the combination of the three matching functions can get more accounts to match for the same user, and the accuracy is also high, reaching 0.923. The successful application of the proposed method on Facebook and Twitter provides a new path to the research of other social media platforms or other related entities.
其他文献
2012年3月新《刑事诉讼法》修正案的通过预示着我国刑事司法的现代化进程进一步加快。作为一项系统性工程,刑事司法的现代化改革,涉及刑事法治理念的现代化转型,既应注重宏观和
在市场经济大背景之下,公司已是市场最为活跃的主体,成为经济发展的有力助推器。目前,公司形式已成为最主要的经济组织形式。但由于公司自身结构特点,法律制度设计缺陷,股东利益多
大学生村官计划是当前中国为建设社会主义新农村而实施的一项重大举措。2008年3月,经中央同意,中央组织部等有关部门决定,从2008年开始,用五年时间选聘10万名高校毕业生到村