基于学术水平相似性的科研合作者推荐模型

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:loopdd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术研究领域的学者们通过组成合作伙伴,丰富了他们的社交关系,加速了科研工作的进展以及研究成果的转化速度。已有的合作者推荐模型没有考虑合作者之间学术水平的差异,从而合作关系难以建立。为了解决上述问题,本文通过考虑学术水平在合作关系中的影响,提出了两种基于学术水平相似性的合作者推荐模型。本文的主要研究工作如下:(1)提出了最合适的合作者推荐模型(Fitting Collaborator Recommendation,FCR),模型考虑到单一学术能力影响力评价指标在应用场景下的限制,结合多种评价指标对学者的学术水平进行量化,设计并定义了适用的学术水平指标ALI(Academic Level Index)。FCR模型首先使用K-means聚类算法,根据ALI指标对学者分层后,在同层学者间搭建合作者网络,并利用Katz指标计算学者间的路径相似度,综合学者的研究主题进行推荐。在MAG数据集上的实验表明,FCR模型对于中级学者的推荐表现最好,并且相较于现有的模型,不但提高了推荐的准确度,召回率和F1指数,而且推荐的学者间学术水平匹配度也更高。其核心的聚类算法对学者分层后,在同层学者间推荐能够减少模型所处理学者的数量,从而提升推荐的效率,适合学者规模较大的合作者推荐场景。(2)提出了基于学术水平相似性的合作者推荐模型(Academic Level Similarity Recommedation,ALSRec),该模型利用FCR模型中定义的学术水平指标ALI,进一步定义了学术水平相似性指标ALS(Academic Level Similarity),并用该指标对合作网络中的边权重赋值,之后使用偏向重启随机游走算法提高学术水平相似学者间的访问概率,将合作关系预测转化为链路预测问题,结合研究主题等因素,在学术水平,研究主题,路径可达性三个角度综合考虑进行推荐。在MAG,DBLP,C-DBLP三个数据集上进行的实验表明,ALSRec推荐模型能够完成推荐任务,且推荐效果好于其它4种其它推荐模型,给出的推荐实例也表明,无论是推荐的准确率,还是推荐的新鲜度,亦或是推荐学者间的MAE值,都有着较好的表现。ALSRec模型推荐结果较为个性化,适合学者规模较小且学者关系稠密的推荐场景。
其他文献
近年来,第五代(Fifth Generation,5G)移动通信网络的大规模商业部署,智能设备和新兴物联网(Internet of Things,Io T)应用的激增,导致频谱稀缺问题变得越来越严重。无人机(Unmanned Aerial Vehicle,UAV)协作的认知无线电网络(Cognitive Radio Network,CRN)缓解了有限的频谱资源和不断增长的数据流量之间的矛盾,并有效
学位
五代北宋全景山水画在中国绘画甚至是文化发展过程中具有较大的作用与价值。本文通过文献考据法、比较研究法、理论联系实践等研究方法,探讨五代北宋全景山水画构图的起源与内涵特征,以及运用方法。笔者的研究运用过程主要分为四个阶段:第一阶段为课题前期调研。笔者收集查阅五代北宋全景山水画构图相关资料进行整合与文献综述,了解此课题美学、历史、哲学等思想角度和画史画论的研究现状,确定本文研究思路和创新点;第二阶段为
学位
面向中文病历文本的实体及关系抽取任务是自然语言处理领域的研究热点,其目标是从医学文本中高效地、自动化地抽取出医学实体及关系。虽然当前基于深度学习的方法在信息抽取研究领域得到广泛应用,但针对中文医学信息抽取的研究工作仍然面临一些挑战:(1)中文医疗信息抽取数据集匮乏;(2)针对医疗这一特殊领域,病历文本包含许多晦涩医学术语,模型对病历中字和词特征的抽取仍然有限;(3)对于中文医学实体和关系抽取任务,
学位
柴姆·苏丁(Chaim Soutine 1893-1943)是20世纪上半叶欧洲表现主义最伟大的艺术家之一,他是巴黎画派的重要代表。苏丁的作品无论在题材的选取、画面的结构、笔触的运用和色块的布局上都对他表现性色彩的形成至关重要。他的绘画风格既受希伯来文化影响,也受到荷兰大师伦勃朗、法国静物画家夏尔丹、现实主义画家库尔贝以及卢浮宫诸多传统绘画大师对他的熏陶;此外,同时代的一些画家和艺术思潮也对他影响
学位
为有效利用野生罗布麻,以罗布麻枝条为原料,采用碱法蒸煮后打浆、碱精制、予酸、漂白等生产工艺生产黏胶纤维用麻浆粕,生产的麻浆粕的甲种纤维素质量分数、灰分质量分数、铁含量、白度等指标符合FZ/T 51009—2014标准的优等品要求。通过正交试验获得了最佳蒸煮、精制、漂白工艺,为以后规模化生产提供了可行性依据。
期刊
生物大脑具有复杂的结构和功能,并且在突触可塑性机制的作用下进行信息的传递、转换和学习。脉冲神经网络应用时间编码的脉冲序列来处理神经信息,是新一代神经计算模型。监督学习算法是脉冲神经网络领域中的重要研究内容,监督学习的目的是通过突触权值的调整,使脉冲神经网络输出特定的目标脉冲序列,从而实现对具体问题的求解。由于各种学习算法都是利用突触前脉冲的信息来计算突触权值的调整,因此参与计算的突触前脉冲数目是影
学位
高速公路情报板是传播交通路况信息的设施,但版面信息布局不合理导致的视认性降低等问题仍然存在。针对情报板不同的布局形式开展视觉测试试验,选取了40名不同测试者,针对不同场景要素,利用驾驶模拟设备,测试试验对象对各类情报板布局形式的反应时间,以此建立情报板版面形式与视认时间的响应关系,进而获得最优版面结构设计形式。
期刊
<正>五大石油巨头正在进行调整,以便在下一个时代的竞争中保持战略优势。近日,《财富》杂志发布了2022年度世界500强企业名单。业内人士注意到,石油与石化行业有3家公司入围,分别是名列第4、5、6位的中国石油集团、中国石化集团和沙特阿美公司,均为国家石油公司。
期刊
近年来,随着互联网技术的发展和模式识别理论的成熟,智能移动设备快速普及并成为人们生活中不可分割的一部分。由于其内置了多种传感器,具有数据采集方便快捷、无需佩戴额外设备、不受实验环境影响和功耗低等优势,基于移动设备传感器的人体行为识别(Human Activity Recognition,HAR)成为研究的一个热点。然而由于人体行为的复杂性,以及人体形态的多样性,导致基于移动设备传感器的人体行为识别
学位
<正>相比于转化,私域更重要的是传递品牌的价值观、调性,这才是私域的长期核心价值。这段时间,我们一直在做世界500强客户的私域服务。本文,我根据自己服务十几家世界500强客户的经验,结合企业微信私域四力增长模型,分享40条我认为做私域比较重要的认知。企业微信私域四力增长模型:品牌私域整体经营状况=组织力×运营力×商品力×产品力。
期刊