基于主题模型和意见领袖的社交网络用户影响关系的挖掘方法

来源 :深圳大学 | 被引量 : 0次 | 上传用户:xiehao2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当社交网络群组交互成为新的运营模式后,对于群组内用户之间的影响关系的研究变得尤为热门。尽管在线社交网络和社交媒体可以让用户很直观地看到用户之间的关注关系,但每个用户只可能知道其邻居用户的少部分好友,无法轻易掌握整个网络结构,并且无法直观的获得关注程度的强弱。因此必须有方法来推断群组内用户之间影响关系,从而进行群组内精准的好友推荐服务或者其它个性化服务。越来越多的用户关系研究旨在增强在线社区用户忠诚度以及活跃度,提升社区的信息服务准确性和效率。社交网络用户关系的创建因素大体分为两种:显示和隐式。在包含显示连接的社交网络中,用户之间的所有联系都是用户有意行为的直接结果,如直接互动,关注。每个用户都在通过明确定义与他人的联系来建立自己的拓扑网络。在包含隐式连接的社交网络中,用户之间的联系是基于对用户资料、行为信息等的“第三方”推理,从而导致拥有相似隐藏信息的用户之间自动或半自动连接。于是本文提出将基于意见领袖的De Groot模型应用到文本为主体的社交网络数据集上,并通过文本的主题分布来挖掘社交网络中成员之间的相互影响关系的方法。该方法能够同时挖掘社交网络用户显示和隐式影响关系,对传统用户影响关系评估技术在假设网络用户间置信度已知、有影响力人物选取的单一性、用户影响关系评估因素粒度大、不能挖掘隐式用户影响关系等不足进行了改进,合理假设社交网络用户观点转移过程,准确选取社交网络群组中有影响力的用户,增加了隐藏信息的提取,扩充了传统方法影响关系评估信息的粒度,并且构建了网络用户间合理的影响方式。同时采用模拟数据对所提出的方法进行了可行性和准确性的验证,当用户意见挖掘误差在一定范围内时,用户之间影响关系挖掘的准确性能够得到保证。最后将该方法运用到Facebook用户群组发贴数据之上,对每位用户相关文本进行了加权汇总,以及有针对性的预处理,精确地挖掘了用户的意见分布,使用该意见分布挖掘出了小组用户之间的影响关系,并使用专业软件进行了用户网络结构的可视化。
其他文献
随着互联网的不断普及和人工智能技术的发展,数据量呈指数增长。在大数据时代,如何从海量的数据中快速获取有价值的信息并有效运用,是数据挖掘分析领域研究的重要问题之一。一图胜千言,将复杂的文本数据以图的形式表达,能够让人们更快更准确的获取所需信息,更好的理解信息,知识图谱由此应运而生。近年来,随着“互联网+”和“中国制造2025”的提出与发展,知识图谱受到工业领域的青睐,智能制造成为了传统工业转型的关键
作为光伏发电技术中光伏电池与电网的重要接口,光伏并网逆变器的研究越来越受到人们的重视。光伏并网逆变器研究中,各类并网逆变器控制策略层出不穷,但是随着一些分布式能源发电的应用,各类并网逆变器中高频电力电子器件等的引入,以及非线性负载等的广泛使用,导致了通信设备与电力电子器件的灵敏度降低,影响并网逆变器的控制过程,导致逆变器输出谐波含量增多,使得并网电流谐波畸变率增大,严重时导致系统不能正常运行。因此
跨境并购是企业快速获取核心技术和战略资源的一种有效的外部途径,越来越多的上市公司通过跨境并购布局全球产业链,加入到全球价值链的竞争中。随着知识经济的兴起,跨境并购的动机除了拓展市场、获取自然资源等目的外,更多的涉及知识资产的获取和转移,知识产权越来越成为跨境并购双方关注的焦点,而东道国的知识产权保护程度会对知识资产的引进、输出和转让等经济行为产生重要的影响。企业在全球价值链中的位置作为企业能力的象
区块链技术和社交网络的结合是未来社交媒体发展的新趋势。传统的中心化社交网络中,网络平台的服务商采集用户数据,开发基于数据的应用获取利益,存在着社交价值的垄断。而具有去中心化属性的区块链技术使得数据公开共享,参与网络的用户可以利用公开的数据开发自己的数据应用,形成了良好的社交生态。其中,社交网络具有明显的社区属性,包含了人际关系特征。通过对社交网络进行社区检测,可以深入分析网络的拓扑结构,发现用户的
区块链技术具有去中心化、安全可信、数据不可篡改的原生优点,具有成为下一代价值互联网的巨大潜力。但是区块链技术目前存在的性能局限严重限制了其发展,因此提高区块链系统性能对区块链技术的发展至关重要。当前常见的区块链扩容方案主要分为链上扩容和链下扩容两种方案,本文针对链上扩容方案(如隔离见证、分片等)存在扩容效果不明显、扩容方案实现难度大等问题,以及链下扩容方案(如闪电网络、侧链技术等)存在中心化风险高
随着大数据时代的到来,数据的预处理在数据挖掘任务中的重要性越来越高。在数据挖掘任务中,数据预处理通常需要花费整个任务的近百分之六十的时间。数据变换是数据预处理过程中的关键步骤之一,数据变换将数据从一种表示形式转换为另一种形式,进而提高聚类和分类算法的性能。本文提出了一种基于1/2相似度偏离的数据变换方法,本文主要包括以下两部分:提出一种新的数据变换方法:权重矩阵学习方法(Weight-matrix
近年来,越来越多的组织将收集到的数据,以RDF模型组织后开放给公众,供人们从中检索感兴趣的内容,获取有价值的信息。通常人们可使用SPARQL这类结构化查询语言访问和操作RDF数据,但由于需要用户熟悉语言语法,了解数据集的内部结构,导致这类语言的使用仅限于专业人士,而关键词检索只需用户输入一组关键词,最终就能返回一些小的包含所有查询关键词的RDF子图,相比结构化的查询语言,极大的降低了对用户的要求。
在新课改的标准下,初中道德与法治课程对学生的培养要求有着翻天覆地的变化,从传统教学模式中过度关注学生对学科知识的掌握,逐步转移到对学生各方面综合素质的培养,尤其是关注学生科学精神在政治教学课程当中的培养情况。所以,这对于初中道德与法治教师的课堂构建也提出了相应的教学要求,需要初中道德与法治教师才最有效的教学策略来完成对学生科学精神的有效培育,结合相应的教学实践措施来帮助学生将所学知识内化为意识当中
区块链存储系统采用分布式基础架构,将全球大量的存储节点构建成一个规模巨大的、全球统一的、共享的存储池向用户提供数据存取服务。在提供存储服务时将用户的数据分散在全球不同的节点中。存储节点通常使用键值(key-value,K-V)存储来管理数据,以固态硬盘作为存储介质。日志结构合并树(Log Structured Merge Tree,LSM-Tree)作为键值存储中最常见的数据结构,通过将随机写入转
随着近几年互联网用户数量和视频数量的增长,视频传输流量成为互联网的流量的主要组成部分。在有限的带宽资源下,满足视频传输的服务质量成为一个挑战。在靠近用户的边缘服务器上缓存视频是减少骨干流量和提高视频传输性能的一个有效方法。然而,现有的工作没有能够有效的解决以下两个问题。第一,视频的流行度变化是动态的,即使是最受欢迎的视频热度也只能持续几个小时。第二,边缘服务器的视频更新成本没有得到适当的考虑。为了