面向社会化媒体的社会网络挖掘与分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:woshizhaozhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会化媒体在网络信息异常充斥的时代对信息流动和交互起到了非常大的推动作用,基于社会网络构架的机制是社会化媒体之所以能够进行广泛而快速的信息流动和传播的机制和源泉,所以使用数据挖掘的技术对社会化媒体中隐含的社会网络进行挖掘并进行分析显得更为重要。对社会网络的自动挖掘有助于更清楚的了解社会化媒体中真正推动其发展的网络机制,并以良好的可视化方式呈现,对该社会网络的分析有助于人们更方便的了解网络情况,据此来支持信息推荐、信息检索、信息传播、电子商务、广告学等应用。本文的主要任务是挖掘社会化媒体中的人物相关性网络,并对该网络进行简要的分析,同时给出了一个基于微博的社会网络应用系统。从数据挖掘、网络构建、网络分析及相关应用的角度来开展本文的研究,主要的工作分为以下三个方面:第一,本文针对维基百科和新浪微博两种社会化媒体,抽取其中的人物实体信息并给出了一种统一的人物建模方法。本文分析了维基百科和新浪微博两种数据的特点,给出了相应的人物实体数据获取方法并对人物实体进行建模。第二,本文给出了一组人物相关性的计算方法,并给出了人物网络的构建方法。根据数据的特点,选择适合的人物相关性方法进行组合即可得到人物之间的相关性计算结果,并通过网络构建方法构建相关的网络,本文通过分析这些方法在维基百科和新浪微博上的准确性证明了相关性计算方法的正确性。第三,在相关性网络的基础上开展了团体挖掘的工作,并介绍了面向微博的社会网络应用系统。首先介绍了网络分析的概念,紧接着介绍了应用于团体挖掘的GN算法,相关的实验证明了人物相关性网络可以充分表示人物之间的关系。本文还给出了对应于本文工作的基于微博的社会网络应用系统和人物推荐的应用。
其他文献
21世纪是信息的社会,油气勘探开发的信息化是油田企业发展的必然趋势,数字油田是油气勘探开发信息化的最终目标。本文着眼于油气田开发信息化的一个侧面——油气田开发动态信
在旅游方案和配餐推荐等一些特定领域,传统的项目(item)推荐系统已经无法满足用户的需求,包推荐(package recommendation)组合式推荐的方式也因此出现。由于包推荐项目组合的
随着计算机技术和网络技术的飞速发展,信息化管理的思想已逐渐渗透到医疗卫生行业领域。医院信息系统(HIS)就是利用计算机技术和网络技术,为医院所属各部门提供病人诊疗信息和
随着汽车电子技术的不断发展,现场总线技术被越来越广泛的应用于汽车网络。但是,至今仍没有一个通信网络可以完全满足未来汽车的有关成本和性能的所有要求。因此,仍将继续采
自主虚拟人是虚拟环境中由计算机生成,具有自主行为控制和自动画表现能力,可对环境变化及时作出合理反应,用于模拟现实世界里人类的行为和特征的仿人软件智能体。自主虚拟人
无线传感器网络作为一种全新的信息获取和处理技术,随着低耗能电子和射频技术的发展,其技术已在国防军事、空间探索、环境监测、反恐抗灾等诸多领域得到广泛应用。但是对于大多
浅层语义分析的目的是分析出句子中谓词(可以是动词或名词等)的语义角色成分,包括施事者、受事者、时间、地点等。作为浅层语义分析的一种实现方式,语义角色标注(Semantic Ro
图像作为一种信息载体,由于其直观、信息量大等特点,得到了广泛的应用。但是,图像在生成或传输的过程中由于种种原因,常常受到噪声的污染。因此,为了能够避开噪声的干扰提取
随着互联网特别是电子商务规模的不断发展,系统中的用户和项目的数据量都在迅速增长。推荐系统可以为用户提供个性化的推荐,因此得到了广泛的应用。协同过滤凭借其简单合理的
随着社会与科学技术的快速发展,人们需求的数据量正呈现爆炸性的增长,对海量数据的存储提出了更高的要求。在海量存储设备的层次存储体系中,光盘库作为海量存储设备中的二级