【摘 要】
:
学术专家检索就是针对给定科学研究领域,依托计算机为工具,借助统计知识、数据挖掘和人工智能等技术寻找该领域内公认的具有较高学术地位和影响力研究工作者的过程。学术专家检索在实际生产、生活中应用较为广泛,对学术专家检索关键技术开展研究有着重要的社会价值和现实意义。目前,学术专家检索面临着传统检索模型功能较为独立和扩展性不强的不足,尽管结合了一部分外在证据资源参与检索任务,但还是存在语义计算性差、外在证据
论文部分内容阅读
学术专家检索就是针对给定科学研究领域,依托计算机为工具,借助统计知识、数据挖掘和人工智能等技术寻找该领域内公认的具有较高学术地位和影响力研究工作者的过程。学术专家检索在实际生产、生活中应用较为广泛,对学术专家检索关键技术开展研究有着重要的社会价值和现实意义。目前,学术专家检索面临着传统检索模型功能较为独立和扩展性不强的不足,尽管结合了一部分外在证据资源参与检索任务,但还是存在语义计算性差、外在证据挖掘不充分,模型融合能力不强,个人专长的广度和深度挖掘不够,不能有效实现多类型指标排名等问题。本文结合学术专家检索过程中涉及的关键技术,系统性对专家检索模型、语义查询和查询扩展、学术影响力评价方法进行研究与探讨,分析目前技术存在的优势及不足并提出新检索模型和优化方法。为充分利用现有检索模型的检索效果,本文将学术影响力评价方法引入到专家检索任务的重排序中,从而进一步提升检索效果。本文主要研究工作如下。(1)贝叶斯网络建模研究。提出了两种基于贝叶斯网络的学术专家检索模型,即简单贝叶斯网络模型和贝叶斯信念网络检索模型。两种模型优点是模型网络拓扑直观,推理过程严谨,易于结合外在证据实现模型扩展;在简单贝叶斯网络专家检索模型基础上提出一种基于术语语义关系的检索模型,在贝叶斯信念网络专家检索模型框架下提出一种基于主题语义的检索模型和一种基于语义的复合检索模型,上述3种扩展模型均可实现语义检索。实验结果表明采用语义计算后上述语义模型检索性能显著提升。(2)面向学术专家检索的查询扩展技术研究。提出了一种基于学术网络和查询相关性的查询术语扩展方法,扩展技术充分利用学术网络中文献节点之间的关系,同时考虑术语在学术资源网络中的传播规律来与查询的相关性,综合提取领域相关术语实现查询术语扩展。(3)学术影响力评价方法研究。提出了一种基于h指数的学术影响力评价方法,新评价方法不仅考查候选专家的h指数,还考查了引文量、论文署名因素对评价效果的影响;提出一种基于加权Leader Rank算法的学术影响力评价方法,新评价方法不仅考查候选专家在合著网络中的影响力,还考查了候选专家之间的合作强度与合作效果。针对目前专家检索模型检索性能低的不足,将新评价方法应用到专家检索的重排序中从而进一步改善候选专家的排序效果。针对目前专家检索技术现状,本文在检索模型构建、语义查询和查询扩展、专家学术影响力评价方向上开展了深入研究,提升其在专家检索任务上的性能。论文构建了新的学术专家检索模型,实现了基于学术网络的查询术语扩展,对不同类型的学术影响力评价方法进行了改进并用于重排序任务。论文所做工作提升了学术专家检索水平,为学术专家检索技术的进步做出了贡献。
其他文献
当前,中国工业部门的就业占比和增加值占比均已被服务业赶超,标志着中国经济正式迈入“经济服务化”阶段,或称之为“后工业化”阶段。这是否意味着中国以工业为主导的工业化进程已经完成?是否表明随着中国服务业超过工业成为第一大产业后,发展服务业将比工业更加紧迫和重要?这些已经成为中国现阶段经济改革和产业政策实施不得不考虑的重大而现实的问题。论文尝试从国别间的部门生产率收敛视角对当前的中国工业化进程做出判断,
目的:“湿性重浊”是湿邪致病的特点之一,其“浊”常表现为排泄物、分泌物秽浊不清,“重”常表现为头身肢体困重、精神倦怠等。本课题基于菌群-肠-脑轴的具体变化,探讨湿邪对小鼠肠道微生态、神经行为学、相关神经递质及其通路等指标的具体影响,以期明确湿邪是如何通过改变肠道微生态来影响行为情绪和神经信号系统的,从而阐明“湿性重浊”的病理机制。方法:使用人工气候箱和高脂饮食分别模拟外湿、内湿之邪,并以20%LD
第一章肠易激综合征伴抑郁症状患者基于体素的脑形态学MRI研究目的:采用基于体素的形态学分析(voxel-based morphometry,VBM)方法,分析肠易激综合征伴抑郁症状(irritable bowel syndrome with depressive symptoms,DEP-IBS)患者脑灰质体积(gray matter volume,GMV)的变化以及抑郁症状在脑结构变化和胃肠道症
研究背景及研究目的根据全球统计数据,卵巢癌是第三大最常见的且死亡率最高的妇科恶性肿瘤,严重威胁女性生命健康,5年生存率仅仅只有30-40%,卵巢癌在女性新发肿瘤中占4%,但死亡率却占5%,这是由于卵巢癌症状隐匿,多数患者就诊时已经处于晚期。以此可见,寻找卵巢癌早期诊断的分子标志物和新的治疗靶点迫在眉睫。细胞的恶性增殖往往涉及到细胞周期的失常调控。细胞周期由细胞周期蛋白依赖性激酶(cyclin de
1.目的(1)研究CYBA基因rs4673、rs9932581多态性与精神分裂症易感性及认知功能、精神症状严重程度的关联性。(2)研究CYBA基因rs9932581多态性与首发未用药精神分裂症患者低频振幅值(Amplitude of low-frequency fluctuation,ALFF)的关联性。(3)研究CYBA基因rs9932581多态性与首发未用药精神分裂症患者脑灰质密度的关联性。2
随着20世纪80年代供应链管理的逐渐兴起与推广,供应链能否在市场竞争中处于优势地位已经成为衡量企业乃至一国全球竞争力的重要指标。为了更好地对供应链进行整合和优化,企业普遍选择少数几个客户作为其主要客户,打造利益共同体和命运共同体。伴随着供应链上下游企业关系的日益紧密,坏消息在客户与供应商企业之间不可避免地产生传染效应。当客户面临严重的财务危机或者未来经营发展前景不好时,供应商企业也无法独善其身,势
目的研究电针治疗对重性抑郁障碍患者抑郁状态、认知功能的改善及其对血清细胞炎症因子白细胞介素(Interleukin,IL)-1β、IL-2、IL-6、肿瘤坏死因子-α(Tumor necrosis factor-α,TNF-α)水平的影响。方法本研究属前瞻性队列研究,本研究共分为3组,其中,入选100例6个月内未服用过抗抑郁药的患者(男女不限,年龄18-60岁),采用随机对照法,将入选的100例重
第一章基于多模态MRI的双相障碍患者脑影像学改变目的:利用基于体素的形态学测量方法(voxel based morphometry,VBM)探究双相障碍患者(bipolar disorder,BD)脑结构改变,利用低频振荡振幅(amplitude of low frequency fluctuations,ALFF)和功能连接(functional connectivity,FC)探究BD患者脑局
物联网数据安全问题备受关注,访问控制机制作为数据保护的基石性技术之一,可以确保数据仅能被拥有相应权限的用户访问。区块链技术为访问控制机制构筑了可信环境,可免除对可信第三方机构的依赖。随着物联网的发展,出现了需要打破数据孤岛进行多方数据共享的多域合作场景,该场景下的各个访问控制域之间互不信任。由于区块链构筑的信任只存在于信任边界内,导致目前基于区块链的访问控制方案无法将权限安全地授予信任边界外的用户
熬夜加班(work-related behaviors after-hours at weekdays’night),是指员工出于主客观原因在工作日或非工作日的晚间继续从事工作相关活动的行为,是下班后工作行为的一种。然而,尽管熬夜加班非常普遍,但关于熬夜加班后效的认识在现实和理论上均仍存在争议。已有研究普遍从资源视角探讨并验证了包括熬夜加班在内的下班后工作行为的消极后效,如持续应激、恢复受阻和工作