基于博客的链接分类研究——以图林博客圈为例

来源 :南京大学 | 被引量 : 0次 | 上传用户:yuanzhiwu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和网络技术的发展,互联网已经逐步渗透到社会生活的各方面,并对其产生了重大影响。因而,越来越多的研究者开始从不同角度研究互联网,以揭示其本质和各方面的规律性。网络链接作为互联网的基本构成要素和最显著的特征,从一开始就是计算机科学和信息管理学研究者所共同关注的对象和研究内容,并逐步形成了针对网络链接进行分析的独特研究领域。链接分析,是源于对网络中页面上链接的研究,而网络上的超链接由于它自身的复杂性和多样性,导致其类型也是多种多样,因此对于链接的分类和识别成为链接分析研究的主要方向之一,但是到目前为止却还没有形成一个比较完备的分类体系,而且在当前有关链接分析测度指标的应用中,如入链数、PageRank算法、网络影响因子以及网站评价体系中的其他链接指标等都是直接应用网站的入链数进行求和统计,并没有对入链的类型加以识别并区分它们彼此的重要程度,因而导致这些测度指标无法准确反映测度对象的影响力。鉴于此,本文在阐述了链接分析机理和链接分类理论后,构建了基于博客的链接分类体系结构,并对各个指标赋予不同的权重,并通过对实际链接数据的统计分析,提出“绝对入链数”和“加权入链数”的概念,然后对比分析了两者在应用上的差异,并利用假设检验方法对此加以验证,从而弥补了链接分类研究中体系结构方面和链接指标测度方面的缺陷,为后续相关研究提供借鉴。   本论文共分六章,各章内容分别如下:   第一章,引言。本章阐述了本文的研究背景和意义、研究内容与目的、研究方法以及本文的创新与不足。   第二章,链接分析概述。首先,本章介绍了超链接和链接分析的基本概念;其次,在把握国内外链接分析相关文献的基础上,梳理了链接分析理论,分别从机理和关系两个角度进行阐述并比较了链接分析和引文分析之间的异同,并对网络链接和引文理论做了比较研究;再次,分析了国内外在链接分析领域内的研究现状,并分别从研究对象、测度方法以及应用范围三个方面展开分析,详细阐述了国内外学者对链接分析研究所作的完善和改进;最后,指出了链接分析当前研究所存在的缺陷,并提出相关改进建议和链接分类研究未来的发展方向。   第三章,链接分类概述。首先,本章从提出问题的角度,分析了链接分类的研究方向,并从链接自身结构和成链动机两个角度阐述了链接分类的必要性;其次,从国内外研究比较的角度分析了链接分类的研究现状,分别罗列并比较了国内外学者各自的分类体系和方法,详细阐述了他们各自关于链接分类的观点;再次,从多个角度分析了当前链接分类所存在的缺陷,并在本文后续研究中对这些缺陷进行改进;最后,根据链接分类的理论、方法以及问题,阐明了链接分类体系构建的意义。   第四章,基于博客的链接分类体系设计。首先,本章综合前文中国内外学者们有关链接分类的研究,再结合图林博客网络自身的特点,总结出链接分类标准,并划分出了基于不同层次的链接类型,并以此构建了三级链接分类体系;其次,介绍了在本文中用来确定指标权重的计量和统计方法;再次,根据前文的方法确定体系中每个不同子类的不同权重;最后,对得出的计算结果进行分析,得出相应的结论,并以此支持后文的实证研究。   第五章,链接分类的应用——图林博客网络影响力评价。首先,在本章研究中事先充分获取了图林博客圈所有博客首页的实际链接数据,并对这十几万条链接数据进行了详细统计和归类,为后来分析研究奠定了基础;其次,利用前文中的链接分类体系对整理统计后的实际数据进行实际分类并计算它们各自的比例,提出了“加权入链数”的概念,并以此来作为图林博客的排名依据,从而以两种不同的方式进行博客排名;最后,分析测试结果,通过统计工具SPSS进行假设检验,以验证两种排序结果的相关度,并给出相应结论。   第六章,结语。本章在前文的基础上总结了本论文对链接分析和链接分类相关理论的贡献,并指出了其中存在的不足,以及指明下一步研究工作的方向。
其他文献
学科战略规划是科技政策的重要组成部分,是科技情报工作的重要内容.在循证决策方法逐渐引起科技决策重视的背景下,将循证决策领域中证据的概念引入到学科战略规划制定流程,从
基于对生成性思维、生物化学变构酶调节机理和变构学习模型的认识,创建情报生成理论:提出并诠释情报生成概念;探讨情报生成的解读系统结构及其转化的变构调节机理、协同模型
在h指数和帕累托效应的启发下,发现一种基于引文数据而评价科研人员及学术期刊的排序方法——ET指数。通过CSSCI引文数据库实际数据测算,利用该方法得到的评价结果与CSSCI原
以国家综合配套改革试验区城市(群)为研究对象,选用修正的广义柯布-道格拉斯生产函数建立回归模型,探讨知识产权在影响区域经济发展的生产要素中的配置与贡献率,结果表明知识
随着互联网信息资源的爆炸式增长,网络信息资源管理面临着众多困境,但不同组织对此提出的多种解决方案在某些方面都存在着缺陷。进入新世纪后,一种全新的互联网范式-web2.0逐渐
学位
从信息的相对性属性和信息分化的社会现象出发,将信息分为强信息(SI)和弱信息(WI).指出在科学研究中,除对主流的强信息进行有效提取外,同样不能忽略弱信息的大量存在.从弱信
基于用户为中心原则,构建查新站质量评价的指标体系,将直觉模糊集理论引入查新站质量评价领域,提出基于自适应神经直觉模糊推理系统的查新站评价方法.首先,采用减法聚类确定
团队教学法是由2名及2名以上教学人员参与、强调施教者和受教者之间的互动、同时强调教与学的共同作用的一种教学方式。昆士兰理工大学(QUT)图书情报学研究生课程(GDLIS)采用
在当今信息爆炸的时代,如何从海量学术文献中高效率地挖掘其中的知识,尤其是以传统文献阅读方式所不容易察觉到的隐含知识,对科学家斟酌和遴选有意义和有价值的科学问题具有重要
在明确界定知识资本和新创企业绩效含义和维度的基础上,阐述知识资本与新创企业绩效实现的作用关系,分析企业创业过程中三项关键活动,即机会利用、资源获取和创业导向选择对