Blog社区的发现与演变追踪技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:uouopolo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Blog是一种基于RSS技术的信息交互平台,它是一种作者与读者以日志风格进行交互的中介,是一种崭新的信息传播和交互方式。与传统的网络信息相比,Blog领域链接关系更加丰富,Blog作者间交互更加频繁,Blog为用户在互联网上发布信息和进行交互提供了方便。随着Blog的迅速发展,信息量的膨胀和信息源的无限增加也给互联网用户查找自己所关心的信息带来了不便。另一方面,Blog作者通过阅读或评论等行为与其感兴趣事件的Blog日志撰写者进行交流,从而围绕这个事件形成很多潜在的社区,如何发现这些社区并分析社区成员之间的关系已成为一个亟待解决的社会学问题。本文综合考虑Blog的内容特征和链接特征,提出了事件驱动的Blog社区发现方法。由于事件是动态发展的,因此事件相关的社区也是不断发展的,本文在Blog社区发现的基础上,对Blog社区演变追踪技术进行了深入研究,提出了一种基于结构的社区演变追踪算法。为了发现社区,本文对基于事件的Blog关系计算方法进行研究,实现了一种双向意识关系计算模型,该模型从社会学角度定义Blog间的关系,并计算Blog关系强度。然后对事件驱动的Blog社区发现进行研究,采用一个基于Blog排序的聚类算法,该算法选取影响力较强的Blog作为种子,然后计算Blog与种子之间的关系数,递归扩展形成以种子Blog为中心的社区。事件是动态发展的,使得事件相关的社区也是动态发展的,本文在社区发现的基础上,对Blog社区演变追踪技术进行了研究,提出一种基于结构的社区演变追踪算法,该算法根据社区演变过程中核心成员比较稳定的原理,分别计算两个时间段社区的核心成员,如果核心成员的交集非空,则判定两个社区具有演变关系。基于以上的研究成果,本文设计并实现了一个事件驱动的Blog社区的发现和演变追踪的实验原型系统,包括了数据解析、关系计算、社区的发现和演变追踪等模块,为进行相关的算法实验和研究提供了一个平台。
其他文献
信息系统安全的重要性已经不言而喻,关乎国家安全的战略决策与发展,而恶意代码是当前信息系统安全的主要威胁之一。恶意代码的传播范围越来越广泛、种类与功能变化越来越快、抗
网络的迅猛发展,增加对地址空间、网络安全以及组播应用等需求,从而加速了IPv6的发展。如今网络已逐渐呈现IPv4和IPv6双网共存的势态:而且这势态将长期共存。本文对当前IPv4
随着现代移动网络飞速发展的时期,尤其是3G时代的到来,促使依托网络带宽的WAP业务得到前所未有的发展,也给相应开展WAP(无线应用协议)业务的企业带来了巨大的商机。企业WAP信
计算机网络的广泛应用给我们带来了方便的同时,也产生了许多意想不到的问题,计算机安全就是其中一个突出的问题。网络入侵检测是信息安全体系结构中的一个重要组成部分,网络入侵
计算机的启动过程是终端系统运行过程中的关键环节之一,如果该过程受到攻击,那么在内核层和虚拟层中的各种安全机制也将失效。因此,开展系统启动过程的安全防护研究具有十分重要
随着互联网的发展,信息资源高速膨胀,形成了一个巨大的、内容丰富的信息库。传统的信息检索方式用户通过关键词检索,系统返回一些相关的网页信息,需要用户主动从这些相关信息
随着集成电路技术的发展,FPGA的容量已达数百万门且具有动态部分可重构功能。由FPGA作为可以动态分配的计算资源与指令集处理器构成的可重构混合系统具有计算性能高、灵活性
学位
在考试中推行无纸化批改阅卷使各类考试更加公平、公正,对贵州省的经济效益、社会效益、科研和教育作出积极的贡献。但是对贵州省这样一个贫困省份来说,要做到推广应用,没有
数据是GIS应用系统的血液,是其应用的关键和核心。由于GIS软件平台非常多,GIS数据结构复杂,各异且在不断发展,而获取数据的手段也复杂多样,这样就形成了各式各样的数据,这使