【摘 要】
:
随着学术论文的爆发式增长,预测论文的引用次数可以帮助学者提前发现更具影响力的论文,具有一定的实际应用价值,因此如何构建有效的引用次数预测模型已成为学术界广为关注的热点问题。目前已有多种文献计量特征和替代计量特征被用于引用次数预测任务中。此外,学术论文的元数据文本即标题和摘要中包含的语义信息对引用次数是有影响的。然而,现有的引用次数预测研究忽略了元数据文本中的上下文语义信息。针对上述不足以及现有研究
论文部分内容阅读
随着学术论文的爆发式增长,预测论文的引用次数可以帮助学者提前发现更具影响力的论文,具有一定的实际应用价值,因此如何构建有效的引用次数预测模型已成为学术界广为关注的热点问题。目前已有多种文献计量特征和替代计量特征被用于引用次数预测任务中。此外,学术论文的元数据文本即标题和摘要中包含的语义信息对引用次数是有影响的。然而,现有的引用次数预测研究忽略了元数据文本中的上下文语义信息。针对上述不足以及现有研究常用的方法不适用于提取语义特征的问题,本文提出了一种新的基于双向长短期记忆网络(Bi-LSTM)与注意力机制的引用次数预测模型BILA。BILA首先应用Doc2Vec算法对元数据文本中的句子进行向量化得到句向量矩阵并将其输入到Bi-LSTM中,接下来使用注意力机制从Bi-LSTM所生成的隐藏状态矩阵中进一步提取元数据文本的深层语义特征,最后将元数据文本的语义表征与早期引用特征进行融合用于长期引用次数预测。在先前提出的方法验证了元数据文本语义特征的有效性的基础上,为了解决Bi-LSTM无法实现并行计算的问题,进一步提升模型的引用次数预测性能,本文提出了一种新的基于层次Transformer的引用次数预测模型HTN,提升了在长文本数据上的计算效率。HTN首先根据词嵌入矩阵和单词位置编码矩阵计算句子级别的上下文语义表征,然后利用句子上下文语义表征矩阵和句子位置编码矩阵生成段落级别的上下文语义表征,最后将段落上下文语义表征与早期引用特征进行融合用于长期引用次数预测。本文收集了人工智能领域的高水平期刊论文来构建引用次数预测数据集,并在该数据集上进行了一系列实验。实验结果验证了BILA模型在长期引用次数预测任务上的有效性与可行性,同时该模型对于高被引论文的引用次数预测也有着良好的效果,并且元数据文本的语义特征有助于提高模型的预测精度。此外,HTN模型具有更好的预测性能,并且进一步加强了元数据文本的语义特征对引用次数预测性能的贡献。
其他文献
小学是儿童身心成长发育的初始阶段,这一阶段的教育会对儿童未来人生观与价值观的形成产生深刻的影响,因此要重视该阶段小学生的心理问题,呵护小学生的心理健康。基于此,从学习、人际关系、情绪三方面介绍了小学生常见的心理问题及其表现,分析了小学生心理问题产生的原因,从医教家结合的角度提出小学生心理问题干预的策略。
我国超常儿童教育已发展四十余年,而超常儿童的心理健康服务则缺少相应的工作模式和相关研究。超常儿童心理咨询的特殊之处在于心理健康工作者需要了解超常儿童的心理特征和需求,同时也需要关注常见的心理咨询议题。本研究将基于超常儿童心理特征和咨询常见议题,结合在学校开展超常儿童心理咨询模式和国外超常儿童心理咨询的经验,探讨我国超常儿童心理咨询现状和可能的发展方向。
<正>当今我们去认识教育教学,必须将信息时代的背景作为前提。社会在改变,学生在改变,学习的形态与方式也在改变。信息数据不仅成为社会经济发展的重要战略性资源,也是教育教学改革、教育发展的重要战略性资源。面对海量信息的迅猛产生,我们必须思考,今天的教育教学与以往有何不同?今天的学校应如何改造?
南美白对虾的养殖价值较高,而要保障健康养殖,需要养殖户了解南美白对虾的关键养殖技术。为促进南美白对虾养殖,分析了选苗、控制池塘条件、防控病害等关键养殖技术,期望促进南美白对虾养殖的模式优化。
<正>[温歌词]水星记词曲:郭顶演唱:郭顶还要多远才能进入你的心还要多久才能和你接近咫尺远近却无法靠近的那个人也等着和你相遇环游的行星怎么可以拥有你《水星记》是由郭顶作词作曲并演唱,收录于专辑《飞行器的执行周期》中。《水星记》的创作灵感来源于水星,是首情歌作品。水星是离太阳最近的一颗行星,但它无法脱离自己的轨道,也无法接近太阳。该曲将情感故事寄于天文,把无言陪伴描述成水星与太阳的相伴而行。
<正>随着社会的不断发展,社会对于人才的需求也发生了明显变化,如今我国教育已经进入到了全面深化改革阶段,新高考、新教材在培养人的模式上发生了根本性的变革。我国高中英语教学活动在开展的时候也十分注重“美育”思想的渗透,目的就是为了培养出全方位发展的人才。在这一背景下,高中英语教学目标和要求自然也发生变化了,教师在为学生讲解英语知识的同时,还需要强化对于学生的审美教育,通过“美育”思想在高中英语教学中
为了揭示影响深圳城市森林林外近景观的主要因子,探究其影响群落林外近景美景度的程度,在前期研究的基础上,运用美景度评价法(SBE)对深圳市不同类型城市森林在不同季节的林外近景观进行景观评价。结果表明:1)深圳市城市森林林外近景观以春季美景度值最高,秋冬季的美景度值最低;森林群落以毛棉杜鹃+浙江润楠+亮叶冬青群落的美景度值最高(SBE值=1.071),柠檬桉群落的林外近景观美景度最低(SBE值=-0.
随着深度学习技术在时间预测领域的广泛应用,越来越多的科学研究者将深度学习方法运用到环境领域。目前,以非点源污染为主的水环境问题日益突出,因此,为了能更好地保护水环境质量,水质的特征趋势分析和预测成为了一项重点研究内容。基于物理过程的机理模型,由于参数众多且参数确定的复杂过程导致其实现有一定的困难。随着计算机技术的发展,深度学习逐渐成为时序预测的主流算法,可以有效克服传统的预测方法出现的问题,但深度