基于神经网络的学者画像研究与应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:xnlpktg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技的发展和大量学术活动的展开催生了对学术服务的需求。学者画像作为最重要的基础应用之一,旨在建立学者多维度标签模型,为专家推荐等上层服务提供结构化数据基础。基于人口统计学属性的学者基础信息标签抽取和研究兴趣标签发掘是开放学者画像问题中的关键任务和热门方向。对此,现有的研究多数基于传统方法构建,存在成本较高、性能受限等问题。随着深度学习技术的发展,其在多项任务上表现出超越传统方法的优势。以此为背景,本文针对上述关键问题,采用基于深度学习方法进行探索和应用研究,以优化其在相关任务策略上的性能表现,同时减少对特征工程的依赖,降低传统方法的构建成本,具有良好的工程应用意义。主要工作内容如下:(1)对于学者基础信息标签抽取问题,本文对现有策略进行研究,设计了基于深度学习的Bi-LSTM+CRF序列标注模型。针对传统方法在词向量表征方面的不足,提出基于BERT的学者信息抽取模型以提高整体性能表现,并通过实验说明本文方法相比基准方法的优势。(2)对于学者研究兴趣标签发掘问题,本文采用基于内容的策略从学者发表的论文中发掘其研究兴趣标签,从而将其转化为文本多标签分类问题。对于场景中存在的论文类别标签相关性依赖,本文设计了基于Seq2Seq框架的论文多标签分类模型。针对分类器忽略标签语义信息、长尾标签性能瓶颈等问题,提出基于标签语义的嵌入向量对原模型进行优化。最后通过实验说明本文方法的优势以及对后续流程的性能提升。(3)设计并实现一个基于深度学习的学者画像原型系统,并基于本文的研究对实际数据进行应用。最后进行系统效果展示和主要功能测试。
其他文献
Real-time and accurate queue length information is very imperative in evaluating the performance and to develop adequate queue management systems,especially under the congested condition in an advance
学位
目前的5G技术以及未来无线通信的发展趋势都对通信系统的峰值速率和频谱效率提出了非常高的要求,但现有的主流无线通信系统都工作在较低的频段,使用着非常有限的频带资源。视频流本身具有高速和大数据量两种特性,非常适合用于研究无线系统的性能,而毫米波所在的频段和其本身带宽也适用于这种场景。本文研究了超高速毫米波硬件平台的数据传输与空口波束成型的实现,搭建了一个功能完备且能够稳定传输视频流的系统。1.针对毫米
纤维增强聚合物(FRP)因其卓越的优点,如高受拉强度-重量比、耐腐蚀、易于搬运和施工以及工作温度范围广,而在土木工程中得到广泛的应用。这些FRP复合材料具有线弹性应力-应变关系,在较小的断裂应变下会发生脆性断裂破坏(CFRP通常在1.5%左右及以下,GFRP在2.5%左右及以下,AFRP在3%左右及以下)。多年来,工程师和研究人员一直在探究如何改造或加固现有的有缺陷的钢筋混凝土柱,以满足新规范的要
近年来,分数阶微积分理论的迅速发展促进了其在反常扩散、湍流、粘弹性力学等领域的应用与研究,由于分数阶导数具有非局部特性,因此分数阶模型能够更准确地描述许多物理过程.本文主要针对两类时间分数阶微分方程,基于Caputo分数阶导数的快速数值算法构造了高效的数值求解模型,通过Chapman-Enskog分析的方法证明了模型的正确性和有效性,并利用丰富的数值算例进行了验证.对于具有Caputo时间分数阶导
学位
产学研数据平台的建设推动了企业与高校学者的交流合作,平台中学者的研究兴趣是企业等用户认识学者和与其合作的重要参考。对学者研究兴趣及时全面地刻画,不仅可以为平台提供初步筛选学者的依据,还可以丰富学者画像的研究兴趣标签,根据研究兴趣标签为其推荐相应企业,同时为学者社区的划分提供数据支持,增加检索结果判断依据。然而,及时全面地更新和分析学者研究兴趣,极大地增加了平台工作者的工作量,并对其相关专业知识提出
在土木工程建设过程中钢筋混凝土结构占据了核心地位,但钢筋易腐蚀的缺点导致这种传统结构的耐久性问题日益凸显,尤其在一些条件恶劣的场合这种劣势更加明显。而具有高强度、轻比重、抗疲劳、耐腐蚀等优点的纤维增强复合材料(FRP)逐渐走入人们的视线,近年来大量的国内外的学者也对其做了大量的试验研究,尝试用FRP筋代替钢筋,这种新型材料有着很好的应用前景。然而,在研究中人们发现FRP筋的弹性模量低,塑性变形能力
根据《2019年中国能源集团500强分析报告》,我国能源电力系统为新旧能源混合的多源体系架构,并亟待电力能源产业的智能化革新和产业升级。电力网络智能化是我国能源技术发展战略中的重要一环,具有举足轻重的地位。电网智能化包括基于先进传感器技术的电网自主态势感知和调控等多个部分,其中电网自主态势感知在整个智能化进程中具有基础性的重要地位。然而,目前针对智能电网态势感知研究中光伏出力数据生成往往受限于大数
快速城市化进程和技术的发展给公众健康带来严峻挑战。进入精细化发展时代,我国城市建设越来越关注人的获得感,提升公众健康水平成为高品质城市空间环境所追求的目标,城市开放空间作为公众接触自然和进行户外休闲性体力活动的重要空间受到多方关注。然而现阶段理论层面对开放空间与体力活动的关联研究较少,难以对健康导向的城市开放空间规划建设提供空间落实层面的有效指导。笔者参与的溧水总体城市设计项目以建设健康城市为背景
This research work is on pedestrian and bicyclist safety and the impact of PTAL levels upon them and when it comes to safety,pedestrians and cyclists are at an inherent disadvantage.Associations like
学位