社会网络中关联用户的挖掘与分析

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:ayun2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅速发展以及网络的普及,越来越多的用户开始通过网络进行各种信息的分享与交流,社会网络的概念也应运而生。在社会网络中,每个行动者都与其他行动者有或多或少的关系,而社会网络分析就是要建立这些关系的模型,力图描述群体关系的结构,研究这种结构对群体功能或者群体内部个体的影响。通过分析社会网络中的人物关系,用户可以获悉在目标网络中哪些用户及信息是最受欢迎的或者是自己最感兴趣的,这对于用户更快更直接地进行信息的分享与交流具有很大的参考价值。因此本文提出了根据社会网络中个体行为的特征来挖掘和分析用户之间的关系以及关联关键字的课题研究。在社会网络中,越来越多的用户采用Blog的形式与他人来分享自己获取的各种信息,而他人也会根据自己的兴趣爱好对信息进行分享与交流。因此,本课题的研究以用户在Blog网站中的行为特征为基本依据,渗入挖掘和分析他们之间的人物关系,进而开发一个人物关系搜索引擎,用于搜索关联用户及其关联关键字。在本文中,把因为某些Blog而存在关系的用户称之为关联用户,该Blog的主题关键字则被称为用户关联关键字。其中,Blog的主题关键字是通过对Blog进行分词,然后根据TFIDF算法计算词的权重而得到的,即Blog中权重最高的词。本文主要研究了社会网络中关联用户的挖掘与分析方法,设计和开发了关联用户查询系统,并以科学家网为例进行了验证和分析。首先对本课题研究的意义以及国内外研究现状进行了介绍,然后阐述了在课题研究与实现中用到的算法基础以及技术理论,包括MD5算法、TFIDF算法、Linux内核单路多IO机制以及网络编程等相关技术。其次,对关联用户查询系统进行了需求分析和总体设计,并描述了系统中关键技术的实现以及算法设计过程,包括抓取部分中的避免重复抓取策略、文件的存储结构、关联用户及其关联关键字的提取以及结果图的显示等。最后,本文对本课题研究的工作进行了总结和展望。
其他文献
随着信息技术的飞速发展,计算机网络技术被融合到了计算机辅助教学当中,并在校园网、局域网、广域网及Internet上得以迅速扩展。目前,计算机辅助教学正向多元化、智能化、网络化
视觉跟踪是计算机视觉领域中一个重要且基础的研究课题,其任务是给定初始帧的目标真值,利用某种算法在后续视频帧中衡量目标的状态信息。近年来,目标跟踪技术已经取得很大的突破,但是这些算法在面对复杂场景或极端条件下的鲁棒性仍有待提高,例如雾霾天气,目标遮挡,低光照等。同时随着传感器技术的成熟,传感器在目标跟踪领域得到广泛的应用。热红外传感器可以捕捉目标的温度信息,弥补可见光数据对光照条件敏感的缺点,同时可
学位
WebGIS是Internet/Intranet网络环境下的一种用于存储、分析、处理、渲染与应用地理数据信息的计算机地理信息系统,其基本思想是在互联网中提供地理信息的发布与共享,使客户
时间序列是指随着时间变化而形成的有序数据序列,它频繁地出现在金融、商业、科学和医疗等各个领域。如何管理和利用这些时序数据,发现隐藏在它们背后的规律和知识,成为人们日益
随着中国经济的飞速发展,铁路运输货物的需求量在飞速增长,其中也包括危险物品的运输。倘若在危险品运输途中发生事故,就会对铁路沿线人民的生命、财产和周围环境造成极大的
随着中国高校招生规模的扩大,高校的毕业人数与日俱增,在传统的毕业设计指导模式下,出现了工作量大,效率偏低的情况。针对这种情况,本文设计毕业设计指导系统的目标就是为指
近年来,随着信息技术的迅猛发展,基础设施系统间的依赖关系变得越来越强,研究具有相互依存关系的网络的鲁棒性能够为基础设施系统的设计与保护提供理论依据和参考价值。  针对
随着人类社会现代化进程的高速推进与经济的快速发展,汽车得到了广泛普及,走进了千百万普通家庭。然而,汽车在给人们的出行带来方便的同时,城市交通拥挤加剧、交通事故频发、
文本分类技术可以用来帮助人们从海量的信息中获取有用信息,它已经得到了广泛地研究和应用。文本分类就是将一些未知的文本与预先定义好的文本类别相互比较,如果这个未知的文
随着新硬件的出现以及新应用领域的发展,人机交互活动越来越成为人们日常活动中一个重要组成部分。由于人手具有的多样性、多义性,以及在时间和空间上的差异性等特点,加之人