基于社会网络分析的论文引用研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:mmmmmmmmmmmmmmmmmmmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引文网络是由文献之间的引用关系构成的一种社会网络。随着信息技术的不断发展,文献资料数量显著增加,引文网络已经成为一个大规模复杂的网络系统,并受到了越来越多的关注。引文网络中包含丰富的知识流和研究成果,是学术领域中非常重要的知识库,所以对引文网络的研究具有非常重要高的学术价值和研究意义。社会网络分析方法在引文网络中的应用解决了引文网络数据量大,计算复杂度高的问题,并区别于统计方法从另外一个角度挖掘引文网络中的资源。在这种背景下,本文利用社会网络分析法,对引文网络进行深入的挖掘分析,其中挖掘的重点集中在引文网络中论文和作者的权威性分析以及引文网络的主题社区挖掘。本文中的具体研究内容涉及以下几个方面:  (1)本文选取社会网络分析方法中的PageRank算法对引文网络中的论文和作者进行权威性分析。利用PageRank算法分别对论文引用网和作者引用网这两个有向网络计算论文和作者的PageRank值,并在计算过程中修改了算法参数使其更适用于引文网络。  (2)参考传统PageRank算法在权威性分析上的应用,并针对算法在引文网络的权威性分析过程中还存在的不足,本文提出了基于带权引用的权威性分析方法。传统PageRank算法在计算作者和论文权威性时是独立实现的,并没有充分利用二者之间的强关联性,基于带权引用的权威性分析方法弥补了这一不足。该方法是以PageRank算法为框架,并将论文引用网络中点的权重设置为作者权重的线性加权值,作者引用网络中点的权重设置为作者发表的论文权重的线性加权值,最后将点的权重加载到权威值的计算过程中。  (3)我们分别从引用结构特征和文本内容特征出发对引文网络进行主题社区挖掘。BGLL算法是基于引用结构特征的社区挖掘算法,可以实现大规模网络的社区发现。LDA模型是基于文本内容特征的主题建模模型,可以挖掘论文集中潜在的主题信息。本文分别以BGLL算法和LDA模型为基础,并添加了引文网络中其他信息,对ANN语料中论文引用网进行主题社区挖掘。本文对以上内容进行了深入的研究,实验结果表明利用社会网络分析方法对引文网络进行权威性分析以及主题社区挖掘取得了优良的成果,为后续研究的深入打下了基础。
其他文献
近年来,随着生物信息计算、网络入侵检测、文本检索等领域数据量的激增,如何从中快速地提取用户感兴趣的信息成为了一项重要的研究课题,而模式匹配与挖掘是其中的重要组成部分,引
随著社会信息化趋势的不断加深,以及互联网内容和应用的不断完善,互联网用户数量也正在迅速增长。目前,作为掌握大量流量数据的网络运营商,有必要深入挖掘流量价值,分析用户
随着博客,商品评论等信息在网络上的涌现,情感分类日益成为一个重要且富有挑战性的课题。情感分类试图根据文本信息,自动评判用户所表达的情感极性(如正面或负面),在电子商务和舆情
随着互联网技术的飞速发展,互联网上的信息呈现指数级增长,人们通过传统的搜索引擎越来越难以获得自己感兴趣的信息,个性化推荐系统就是在这种背景下产生的一种帮助用户解决
随着无线通信的快速发展和移动技术的日臻成熟,军事通信、抢险救灾、临时会议等大量应用,对没有固定基础设施支持的临时组网提出了迫切需求。在这种需求下,出现了Ad Hoc网络这
近年来,随着互联网数据呈现出爆炸式的增长趋势,推荐技术已成为解决互联网信息过载问题的一种有效途径,并已成为人工智能、数据挖掘、机器学习等领域内的一个热门科研课题。另一
AdHoc网络是一种无需固定基础设施支撑的无线网络组成形式,它由于造价低廉、组网快速灵活,因而受到人们的广泛关注和研究。通常情况下,AdHoc网络中源节点往往不能直接把数据
为了提高对肺部低对比度血管和细小血管的检测效果,以及降低非血管结构对血管提取的影响,本文提出了基于匹配滤波器的三维肺血管提取方法。这种方法由肺部分割、血管提取和血管
网络环境中陌生实体间信任关系的建立是实现资源共享和互操作的前提。自动信任协商作为一种新型的访问控制技术,它为处于不同安全域的陌生实体间建立信任关系提供有效地方法,进
随着移动终端设备、高可靠性存储及高性能存储服务等应用对于体积小、重量轻、零噪声、高可靠性存储器的需求日趋强烈,基于NAND Flash型器件的存储设备在存储市场中占据越来越