基于引文网络的多作者论文归属判定算法的研究与应用

被引量 : 0次 | 上传用户:flytraker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国际间学术合作的加强和“开放科学”运动的兴起,科研合作与文章合著已逐渐成为现代科学进一步发展的主流趋势。以往评判单一作者科研成果的方法无法较好地体现出现代科研合作中作者的贡献多样性,无法将某作者的贡献与其他合作者区分开来。而科学界中进行工作任命、职称评定或基金授予等重要决策时,其依据基本来源于某学者个人的成果评价,因此如何合理地判定科研文献能否归属于某一作者就显得尤为重要。本文旨在通过引入文献的相对影响力以及通过移除目标论文贡献权重降低给成果所有者带来的稀释效果来改进归属判定分配算法,为解决文章归属问题提供补充解法。科研文献的被引用次数变化趋势包括两类“延迟攀升-缓慢衰减”和“提前攀升-迅速衰减”,因此本文引入非线性函数来将文献影响力与被引用次数相结合,从而表征文献的相对影响力。由于科研文献的归属分配问题并没有统一的识别标准,因此本文选择了目前全世界研究学者都较为认可的国际级奖项诺贝尔奖来验证识别效果,以其中提名与授予标准更加严格的诺贝尔物理学奖文献作为本文的数据验证集。本文以分配算法识别到的成果所有者是否是获得诺奖的作者作为判断标准,根据American Physical Society数据集和Microsoft Academic Graph数据集中检索到的目前最全面的获得诺贝尔物理学奖的相关文献数据,综合对比了目前主流的前沿算法。首先,本文引入了修正后的Sigmoid函数来表征文献的相对影响力大小,通过去除目标论文贡献权重提高了成果所有者与其他作者之间的区分度,降低了该权重带来的稀释效果,在此基础上提出了NCCAS分配算法,接着与目前主流算法CCA、NCCA、DCA以及Co CA分配法对比了识别准确率、识别分辨率,然后进行了鲁棒性测试。并且通过消融实验对比了目标论文贡献对于分配算法识别准确率与分辨率的影响,还探究了对以往科研成果给定不同权重构建作者贡献度矩阵对于分配算法的影响。另外,本文通过对MAG数据集中收录的9个学科领域内(1990年至2009年)大规模文献数据进行成果归属分配,探究大小团队中成果所有者(最高归属分数作者)对应不同学科领域、不同文献发表时间内的相关学术指标的分布情况,同时也探究了不同引文积累窗口长度与文献成果所属的关联关系。研究发现:(1)针对NCCAS分配法,综合上述对比实验发现:本文提出的NCCAS分配法综合表现优于其他主流算法。(2)本文针对MAG数据集中大规模科研文献数据应用分配算法进行计算,对大小团队中的成果所有者相关学术指标进行分析。发现了大小团队中成果所有者对应学术指标的分布情况与日常认知存在差异:(1)相对学术年龄的分布中,大团队内的成果所有者多为合著作者中非年长学者,小团队内则多为最年长学者。(2)作者署名位置的分布中,大小团队的成果所有者没有表现出对第一作者或最后一位作者的偏向性,两者可能性接近,但小团队中第一作者与最后一位作者相比大团队内更有可能成为成果所有者。(3)跨学科领域数量的分布中,大团队内成果所有者更可能是跨学科领域数量非最多的作者,而小团队内则超过50%的可能性是数量最多的作者。(4)发表文献数量的分布中,大小团队内成果所有者多为合著作者中发表文献数量最多的作者。同时成果所有者中年长学者与非年长学者的绝对学术年龄逐渐表现出“学术老龄化”的现象。(3)针对设置不同长度的引文积累时间窗口T,本文对符合筛选条件的科研文献应用归属分配算法后,将(T,T+1)两个引文积累窗口内分配结果中成果所有者不一致的情况定义为颠覆性情况,以此来衡量不同窗口大小与文献成果所属的关联关系。另外,探究不同窗口大小下相关学术指标分布是否仍然遵循(2)中的规律。结果发现:在不同引文窗口大小的情况下,颠覆性情况占比较小,且同时随着引文积累窗口的增大而减小。当窗口T≥7时,该占比几乎趋近于0;同时在不同窗口大小下,成果所有者对应的相关学术指标在总体分布和变化趋势上仍保持一致,但具体的区间占比会受到引文窗口大小的影响。综上所述,本文通过引入文献相对影响力并移除目标论文贡献权重构建的归属判定分配算法NCCAS,能够为高影响力(以诺贝尔物理学奖文献作为数据验证集)和普通的学术文献合理分配成果归属。同时,根据普通学术文献分配结果,发现了大小团队内成果所有者对应学术指标分布的规律性,且这种分布不受分配算法、学科领域、文献发表时间、引文积累窗口长度的变化影响,也在对应的学术指标分布的变化趋势中发现了“学术老龄化”的现象,对我国未来人才引进以及科研工作开展具有参考意义。
其他文献
学位
学位
分析网侧变换器运行中的工作原理,根据两相同步坐标系建立网侧变换器的数学模型,采用电网电压定向的控制策略方法,使网侧变换器交流测保持单位功率因数运行,直流侧输出更稳定质量的直流电压。
期刊
社会活动是人类基于合作关系所产生的活动,由此可见,人类社会不可能脱离合作关系而存在。自20世纪起,人类的社会关系在持续发展的基础上促进了各种社会形态的诞生,而社会形态的不同,直接创造出了不同的社会治理模式,如权治、法治、德治等。但与之相对的是,人类社会关系的发展与变化并未彻底撼动已有的社会治理模式。世界各国对社会治理变革都有着较高的期待,这直接促进了社会治理理论的发展,其内容不断丰富,社会治理实践
期刊
在教学过程中,导入环节是必不可少的。由于导入环节在教学的起始阶段,所以其作用会体现在整个教学过程中。所以,在小学音乐教学中,如何进行有效的课堂导入是教师需要着重思考的问题。因此,笔者通过资料分析与直接观察相结合的方式,对小学音乐课堂导入的策略展开了探索。本文将研究中产生的认识作为依据,分析了小学音乐课堂导入的现状,思考了进行小学音乐课堂导入的原则以及具体策略。
期刊
本文针对伺服电机提出了一种基于集员卡尔曼滤波器的故障诊断方法并进行了实际应用.首先,基于运动学关系和数据驱动技术构建了伺服电机的综合系统动态.之后,针对电机的位置-速度模型设计了一个中心对称多面体卡尔曼滤波器来检测位置传感器和速度传感器是否发生故障.同时,针对电机的力矩-速度模型设计了一个中心对称多面体卡尔曼滤波器来检测力矩执行器故障和速度传感器故障.然后,基于上述的两个中心对称多面体卡尔曼滤波器
期刊
人类与新冠病毒作斗争,现已进入后疫情时代常态化防控阶段。由于新冠肺炎具有较长的潜伏期,公共场所人流量大、交叉感染概率大,所以对于低、中风险区域重点场所需采取加强人员健康监测、查验健康码等措施。中国坚持常态化精准防控和动态清零,对人员的信息管理工作要求也更加严格。因此疫情防控信息管理工具在监测人员健康状态、人员信息管理等方面还有许多值得研究改进的地方。该研究课题来源于本人实习期间所参与的便民核验通疫
学位
<正>意识障碍(disorder of consciousness,DOC)是继发于脑部器质性疾病的一系列觉醒和认知障碍,包括植物状态(vegetative state,VS)和微意识状态(minimally conscious state,MCS)[1]。随着临床危重症患者的救治水平大幅度提高,更多的生命得以挽救,其中有5%—10%的患者在度过急性昏迷(通常2—4周)后仍无法恢复意识,因而严重脑
期刊
对异步电机故障进行分析和诊断,可以减少停机时间和维护成本.在键合图理论的基础上,提出将线性分式变换和诊断键合图模型结合的故障诊断方法.首先,搭建异步电机键合图模型,通过添加虚拟传感器将键合图模型转换为诊断键合图模型,由虚拟传感器求出残差.然后,通过分析模型中元件的因果关系消除未知变量,从而推导出解析冗余式和故障特征矩阵.针对元件参数的不确定性,提出基于线性分式变换搭建不确定性键合图模型来构造自适应
期刊
目的 探讨晚期非小细胞肺癌伴恶性浆膜腔积液的治疗方法。方法 回顾性分析1例晚期非小细胞肺癌伴恶性浆膜腔积液患者的病例资料并检索相关文献。结果 患者于2021年经病理诊断为晚期非小细胞肺癌伴浆膜腔积液,给与12个周期的卡瑞利珠单抗联合重组人血管内皮抑制素治疗后,疾病稳定,积液控制良好。结论 本例晚期非小细胞肺癌患者疾病状态不佳,治疗上尚无令人满意的治疗药物,该治疗方案为晚期非小细胞肺癌伴恶性浆膜腔积
期刊