基于Web of Science的作者合作关系分析研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:nbxtihc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术不断发展,学术成果不断涌现,学者们可以使用各种分析方法来挖掘学术成果之间的隐藏关系,并探索学术合作的规律。其中,学术合作关系的分析逐渐成为研究热点,对作者合作进行研究可以了解作者合作形成的原因和研究领域的发展态势,帮助学者更方便地寻找到合作伙伴,促进科研合作的形成和科研成果的不断产生。本文首先对学者合作规律以及影响因素进行了数据分析;在此基础上,采用基于链路预测和基于网络表示学习两种方法建立了学者合作关系预测模型,并在传统模型中加入了学者外部属性这类新特征,实验证明此类特征能够有效提高模型的预测准确率。本文通过总结前人的文献,基于统计学方法,选择两类作者合作关系的影响因素,从合作网络拓扑特征和作者特征两个方面进行度量。合作网络拓扑特征选择了链路预测特征和网络表示学习特征。其中链路预测特征包括Common Neighbours(CN),Adamic-Adar(AA),Resource Allocation(RA),Jaccard,Katz,Graph Distance(GD),Sim Rank;网络表示学习特征为使用Large-scale Information Network Embedding(LINE)算法计算得到的作者向量。作者特征选择了作者的学术年龄、发文量、合作率、研究兴趣、所在机构和地区。本文使用Web of Science核心数据库图书情报领域(1945-2018)数据集,计算得到链路预测特征、网络表示学习特征和作者外部特征的量化,基于链路预测和基于网络表示学习两种方法建立了学者合作关系预测模型,分别将作者特征引入到上述两种模型中,并与原模型进行比较,最终形成四个预测模型。通过四种模型的验证实验,基于模型精度指标,发现使用链路预测特征和作者外部特征时模型预测效果最好,精度可达。通过比较模型输出的各特征基尼系数大小,发现作者合作率的差异、作者发文数和学术年龄差异与作者合作与否呈负相关关系,且影响系数较高;作者是否为同一国家和同一机构对作者合作与否存在正相关关系。
其他文献
氧化固醇结合蛋白(OSBP)及其相关蛋白(OSBP related proteins,ORPs)共同构成ORP家族,保守存在于酵母、植物、哺乳动物中,它们在信号转导、脂质代谢和非囊泡运输等过程中都发挥着重要的作用。该家族属于脂质转运蛋白(LTP)超家族,所有家族成员都具有一个保守的OSBP相关结构域(OSBP-related domain,ORD),能够结合固醇及甘油磷脂。研究表明氧化固醇可以抑制
蛇形机器人是由串联的连杆构成的具有高冗余度的机器人,具有丰富的应用场景与研究价值。但是其复杂的相互耦合的结构使得对其的研究有难度。本文通过蛇形机器人的结构特点来
目的:运用DTI技术通过基于解剖图谱的分析(atlas-based analysis,ABA)方法探究终末期肾病(end stage renal disease,ESRD)伴睡眠障碍(sleep disorder,SD)并长期进行维持性血
目的:探讨脓毒症合并肝功能障碍患者血清肉碱谱的浓度与肝功能障碍程度、病情严重程度及最终预后转归的相关性。方法:采用回顾性观察研究的方法,收集2015年9月至2018年12月期
古籍文献具有重要的历史和学术研究价值,不同版本的古籍文献中文字的差异性比较是古籍文献与古籍汉字相关研究的重要内容。传统的人工比对方式效率低、准确性差。随着信息技
视网膜血管是人体唯一可以无创伤直接观察的较深层微血管,是许多眼底疾病如青光眼等以及系统性疾病如糖尿病视网膜病变、高血压等的观察窗口。眼底彩照技术是眼科临床常用的
土壤盐渍化是影响林业可持续发展及生态环境建设的重要限制因素之一。盐胁迫对植物的伤害主要是由于土壤中高浓度盐离子(特别是Na+)引起,过多的Na+进入植物体内导致离子失衡和
在临床诊断与医学研究中,血管是十分重要的生物组织。视网膜血管是人体仅有的能直接进行观察的血管网络,作为眼底图像的重要特征,其结构和形态的改变与高血压、糖尿病、动脉
近年来,随着机器学习技术的飞速发展,人脸识别在准确度和速率等方面有了很大突破,一些最新的研究成果,如FaceNet、DeepFace、DeepID等,其准确率已经接近甚至超过了人类识别的
端到端的基于神经网络的方法是目前图像标题(Image Caption)任务的主流方法。目前大部分研究都集中于单一语言(如英文)的图像标题研究,并取得了很好的性能。但是在很多时候,