社交网络环境下的词特征重建算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:J2EE_BOY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体平台上存在着大量用户发表的和分享的多模态数据,其中文本数据作为众多形式信息中广泛存在的数据载体,是实现用户主题建模、兴趣挖掘以及个性化推荐等任务的基础。如何利用从文本中抽取的词特征信息进行上述数据挖掘任务是目前社交媒体数据挖掘领域中的一个研究热点。同时,社交媒体中存在许多用户(冷启动用户)只含有少量文本信息甚至完全缺乏文本信息,难以从其历史数据中抽取有效的文本信息,使得许多任务无法展开。因此,解决冷启动用户的词特征重建问题可以对很多使用文本的数据挖掘任务作出重要贡献。针对社交媒体平台中部分用户缺乏文本信息甚至完全没有文本信息的问题本文提出了解决方法。(1)提出融入用户的信任关系作为辅助信息的方法,研究如何利用社交媒体用户间的关注关系构建用户信任关系矩阵。在twitter和微博的四组数据上的实验结果表明,可有效解决社交媒体冷启动用户的词特征重建准确率问题。(2)考虑到词特征信息的特殊性,提出融入词相关关系信息作为另一个辅助信息的方法,计算词与词之间的相似度,将相似度值作为权重来构建词相关关系矩阵,挖掘词与词之间的隐藏关系,然后我们将上述构建的用户信任关系矩阵、词相关关系矩阵与用户词频矩阵进行联合概率矩阵分解,充分利用用户间的信任关系,词相关关系与用户词频关系,在共享的低维特征空间上得到用户的隐含特征矩阵与词特征的隐含特征矩阵。进而利用用户潜在特征矩阵与词潜在特征矩阵重建用户-词频矩阵,进而完成对社交媒体冷启动用户的词特征重建工作。(3)围绕社交媒体用户词特征重建问题,本文设计实现了用户的词特征重建应用系统,其中针对缺乏文本信息的冷启动用户,构建了社交媒体冷启动用户词特征重建模块,重建结果的词云展示验证了本文算法的有效性。
其他文献
氧化钇增韧的氧化锆生物医用陶瓷具有高硬度、耐高温、抗腐蚀、耐磨损以及良好的生物相容性等性能,但是其断裂韧性、耐冲击载荷和热冲击能力较差。而钛合金具有重量轻、强度
CF4、CH4和SiF4都是正四面体结构的多原子分子,这三种分子在工业当中应用非常广泛,所以在理论方面和实验方面研究这三种分子光谱相关数据有着非常重要的意义。本文的核心工作
本文主要研究了一类分数阶微分方程初值问题解的存在性及渐近估计,一类带弱奇异积分核的积分微分方程初值问题解的存在性及渐近估计,一类分数阶微分方程耦合系统解的存在性等
本文主要研究了六角系统上一般零阶积(和)连通指标的极值问题、一般二阶积连通指标的极值问题以及二阶和连通指标的极值问题,并且对一般一阶积连通指标和一般一阶和连通指标
研究背景和目的结直肠癌(Colorectalcancer,CRC)及胃癌(Gastriccancer)是世界上常见的消化道恶性肿瘤。在美国等发达国家结直肠癌居癌症发病率第三位,死亡率第二位,其在我国
本文主要根据期权的价格会受到过去时间信息影响的想法,研究了一个由Lévy过程驱动的时滞期权定价的模型。将Black-Scholes模型中的市场加入时滞的影响,建立市场的期权定价模
我国自主研发的BDS不仅包括中圆地球轨道卫星(MEO),还包括地球静止轨道卫星(GEO)以及倾斜地球同步轨道卫星(IGSO)。分析研究BDS不同星座的卫星对于精密单点定位(PPP)参数估计
直接醇类燃料电池作为一种高效环保的能源设备,其具有高能量密度,污染物排放量低和操作温度温和的特点。醇类燃料的氧化过程很缓慢而且机理复杂,实现燃料电池的商业化需要开发高效的醇类氧化催化剂。Pt是最高效的醇类氧化单金属催化剂,然而其表面容易被吸附的中间体毒化,导致催化剂活性和稳定性降低。考虑到其具有独特的催化能力却储量有限,因此需要提高Pt在燃料电池技术应用中的催化效率。本论文旨在制备稳定高效的直接醇
无线传感器网络广泛应用于环境监测、智能家居、国防军事和智能医疗等领域。网络中的数据传输依赖于无线通信技术。由于缺少物理边界的保护,无线通信容易受到非认证性监听和
随着信息技术的飞速发展,固态存储系统高性能、体积小、无噪音等优点使其应用广泛。然而,随着固态存储设备制作工艺的不断深入,固态硬盘(SSD,solid state drive)中数据差错率