社交媒体用户识别方法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:zst_chengdu_xxxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着移动网络技术的发展,社交媒体用户数量迎来了爆炸式增长,社交媒体已然成为存储用户信息的庞大数据库。社交媒体用户识别是指对用户的账号信息、属性信息、心理状况和行为习惯等相关内容进行识别。出于不同的社交目的,同一用户通常会在不同的社交应用中注册多个账号,并且有可能提供不同的身份信息。通过社交媒体用户识别技术匹配不同平台的用户账号,构建全面的用户信息库,从而为商品推荐、信息检索和网络空间监管等下游应用提供有效支撑。同时出于保护个人隐私的考虑,用户往往会选择隐藏个人信息,这导致用户某些有价值的属性信息难以直接获取。通过社交媒体用户识别技术对用户缺失的属性信息进行推测,能够进一步完善用户信息库,从而更加全面地了解用户。本文针对社交媒体用户识别问题,从跨社交媒体的用户账号匹配和社交媒体用户属性识别两方面开展研究,主要贡献包括如下两方面内容:(1)提出了一种基于维特比算法的社交媒体账号匹配方法。传统的账号匹配方法存在着匹配效率低下和多平台账号匹配准确率低的问题。本论文通过以下三个步骤解决了传统方法存在的问题。首先,该方法基于账号用户名相似性构建候选匹配账号集合,通过缩小候选匹配账号集合的大小解决了传统方法匹配效率低下的问题。其次,该方法根据账号的注册信息计算账号之间的相似度并构建匹配网络。最后,使用维特比算法在匹配网络中找到最佳匹配账号实现了多平台账号匹配,与传统方法相比较,本论文方法的多平台匹配准确率有所提高。(2)提出了一种基于图嵌入的社交媒体用户属性识别方法。传统的用户属性识别方法大多采用有监督学习的方式,其属性识别准确率较低且严重依赖于标记数据的数量和质量。本论文通过以下三个步骤解决了传统方法存在的问题。首先,该方法基于文本主题和维基百科实体构建异质网络,通过在异质网络中引入不同类型的节点丰富了异质网络的语义信息。其次,该方法使用图嵌入算法获得异质网络中用户节点的嵌入表示。最后,基于用户节点的嵌入向量对社交媒体用户属性进行识别。本论文方法是一种半监督学习方法,其属性识别准确率受标记数据影响较小,与传统的方法相比较,该方法使用较少的训练数据就取得了较高的准确率,解决了传统方法属性识别准确率严重依赖于标记数据的问题。
其他文献
2014年,W县爆发企业民间借贷危机,W县政府迅速做出反应处置该次危机。笔者通过亲自参与整个处置过程,发现W县政府对该次危机的处置呈现出“弱监管而强处置”的特征。该种特征
近年来,光纤光栅阵列传感技术逐渐应用于安防系统中,但光栅阵列伴随着噪声多,容量大、信号信息难获取的特点,使得安防系统的监测受到很大困扰。传统的监督聚类算法,例如DBSCA
本文在研究和总结国内外关于逆物流的理论和实例的基础上,通过分析电子产品企业实施逆向物流其对企业和社会层面的影响因素,构建逆物流绩效综合评价指标体系,探讨了层次分析
自2001年我国加入WTO以后,中国的进出口贸易得到了快速增长。2013年,中国进出口总值第一次突破4万亿美元成为世界第一大贸易国,货物进出口总额和出口总额位列第一位,同年我国经济结构发生了一个具有历史意义的重大变化,第三次产业比例首次超过了第二产业比例;到了2014年,我国进出口总额继续保持增长,并保持在世界第一位;2015年,虽然中国经济增速放缓,进入经济“新常态”,但是连续三年全球货物贸易蝉
本文主要研究辽河油田东部凹陷红星地区火成岩储层,从火成岩旋回期次划分、火成岩岩相的空间展布预测、裂缝预测及火成岩储层预测四个方面,对红星地区沙三中下段火成岩的地质
图像在获取、成像、处理、存储等过程中,容易受到外界因素的干扰而产生降质,退化为模糊图像。图像复原技术可以一定程度上将退化后的图像清晰化。本文从实际的项目出发,将项目中带有离焦模糊的人脸图像作为研究对象,运用图像盲复原技术来处理图像,希望提高图像质量和人脸识别的效果。由于现有的方法没有针对性地复原离焦人脸的特征,且大多是针对全局模糊图像进行处理的,本文为了更好地解决这个课题,将研究内容分为两个部分:
近年来,得益于信息、材料、微加工技术等多学科的发展,光纤传感器的种类越来越多,许多基于智能敏感材料的光纤微型结构传感器被提出来,极大丰富了光纤传感器的应用领域。与传
吸收和散射是光与物质相互作用的主要形式。在细胞悬浮液、生物组织、血液、食品、农作物、土壤、环境污水等混浊材料中,材料对光具有较强的光散射特性;同时材料的分子结构差
声表面波(SAW)传感器利用声表面波技术,将所测量的物理量转换成我们需要的电信号。由于SAW的绝大部分能量集中在基底表面,故该传感器对外界环境极其敏感,具有非常好的灵敏度。细菌纤维素(BC)由超细的丝状纤维相互交织形成发达的超精细网状结构,且表面含有大量的孔隙及羟基基团,非常适用于作为传感器的敏感膜材料。本文研究了基于BC敏感膜的湿敏性能及其特定结构用以改善聚乙烯亚胺(PEI)对甲醛气体的气敏性能
机械设备的故障诊断一般以振动信号作为研究载体,传统的做法是先降低信号的噪声,然后进行时频分析,提取信号特征,与已知的故障特征进行匹配,来判断机械设备是否发生故障。而随着大数据的发展,海量的振动信号让人为的故障识别变成了一件不可能完成的任务,必须借助人工智能的算法来代替人们实现故障诊断。如何结合先进的信号降噪、特征提取技术以及优秀的机器学习算法,是本文研究的重点。本文将会通过对信号的降噪技术、信号的