论文部分内容阅读
在当今学术社会,科研活动的复杂化、国际化、多元化和学科交叉化趋势越来越明显,正在成为科研的“第四纪元”。科学家之间学术合作行为得到了不同领域的学者的广泛关注,是典型的交叉学科的前沿研究方向,其研究领域包括计算社会科学、网络科学和计算机科学等。伴随着海量的学术相关数据,学术大数据研究应运而生。学术大数据可以从数据的角度出发,帮助人们理解学术社会和学者,促进科学技术发展更加合理化和高效化;可以帮助学者发现科研规律,提高创新能力和科研效率;可以帮助国家制定科技发展战略、路线和方针提供理论依据和方法支撑。然而学术大数据研究仍面临一些重要的困难和挑战,如关系动态演化、属性多维度、网络高维稀疏和推荐多样性等问题。人们对学术合作机制,特别是合作模式演化和合作关系预测的研究还远远不足。为解决以上四个关键问题,本文围绕现有研究尚未解决的多个科学问题以及学术合作中的可持续性现象,结合学术大数据的高动态、强异构和大规模等特性,研究基于学术大数据的科学家合作行为,探索学术合作规律,提供个性化学术服务,主要贡献如下:1.学术合作模式动态演化分析。针对学术合作模式动态演化问题,提出一种基于学术年龄的学术合作模式动态演化分析方法,分析表征学者合作模式的中心网络特征随学术年龄演化趋势,并研究不同年代学者合作模式变化规律,计算机领域和物理领域两个不同学科的科学家合作模式。2.学术合作可持续性预测。针对学者属性多维度问题,提出多维度学者画像模型,通过考虑学者的人口统计特性、学术研究、学术影响力和社交属性四个维度对学者进行量化表征,分析不同维度特征和合作可持续性之间的关系,根据多维学者画像模型预测学术合作可持续性,提升预测结果的准确性。3.可持续性合作者推荐。针对学术合作者推荐系统难以满足多样化推荐的问题,提出基于会议闭包的可持续性合作者推荐方法。基于学者共同参会关系和社会科学中的弱关系理论,提出学术合作的会议闭包机制和量化方法,通过会议闭包构建加权学术合作网络进行可持续性合作者推荐,提升推荐结果的多样性和新奇性。4.合作伴侣识别。针对学术合作网络中高维稀疏问题,提出一种结合文本信息学术合作网络表示学习方法识别学术伴侣,通过词向量学习方法获取学者研究兴趣向量,利用研究兴趣向量重构学术合作网络,在重构网络中获得学者的低维向量表示。在降低计算复杂度的同时,可以更准确地计算学者相似性;提高学术伴侣识别的准确性。