科研文献系统中专家画像技术研究与应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:maxiao19810628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,科研工作越来越依赖于互联网,科研人员越来越频繁的在互联网上进行学术交流、科研成果共享和学术检索等工作。与此同时,各类科研文献系统也发展起来。专家画像系统,作为科研文献管理系统中的子系统,建立起专家与专家、专家与机构以及专家与科研领域之间的诸多联系,因为具有很好的实用价值和深远的现实意义。本文针对专家画像系统的建立进行技术研究,从元数据提取和数据挖掘两方面研究了专家画像系统中基于PDF的元数据提取、研究领域挖掘、专家关系挖掘、文献聚类、标签抽取几个方面的关键问题。首先,研究了基于PDF的元数据提取,区别于其他按照行进行分类的研究方法,本文采用了基于段落的元数据分类方法,并设计了一种基于规则和支持向量机的混合元数据提取模型。然后,研究了专家画像系统之家各实体之间的关系,设计基于频繁项集和并查集的算法挖掘研究领域信息,并利用挖掘产生的研究领域改进了 K-Means聚类算法,对文献进行聚类。在标签的抽取技术中,充分考虑全局和局部词汇关系,改进了典型的TextRank模型,提出一种基于顶点和边融合加权的TextRank关键词和关键短语抽取模型。同时,结合专家之间的社会合作关系,对专家进行标签的标记。在从文献中抽取标签的基础上,研究了专家的聚合模型,并采用频繁项挖掘算法聚合专家研究的兴趣领域与合作专家的关联关系。最后,应用本文研究得到的技术成果,对专家画像系统进行设计和实现。使用可视化的图表组件对挖掘数据进行显示,得到一个数据完善、具有良好可视化效果的专家画像系统。结果表明,充分深入的技术研究对专家画像系统的易用性、扩展性、性能、展示效果等方面具有重要意义。
其他文献
随着互联网技术的发展和人们对于电子支付需求的不断增加,移动支付受到越来越多的关注。因其不受空间限制、方便快捷、随时随地开展交易等诸多优点,移动支付发展迅猛并且正在
随着计算机网络技术、多媒体技术及视频检索技术的飞速发展,多媒体信息数据在社会生活中的应用也变得越来越广泛,尤其是视频信息数据的处理。重大危险源的监控视频信息的完整性
随着互联网技术的飞速发展,在网络上制作、拷贝、传播和发布多媒体数字作品变得更加的容易,信息隐藏技术为日益严峻的多媒体信息安全和知识产权保护提供了一个十分有效且非常
为了将互联网中纷繁复杂的信息快捷准确地呈现在用户面前,各种信息获取系统大量出现。信息获取是从网页中获得知识的手段,通常包括信息网页获取,信息抽取,信息去重等步骤。信
空间数据是指那些带有地理位置信息的数据。在当前的大数据时代,空间数据占了很大的比例,并且在处理时具有自身的特点。与此同时,时间维度的数据分析,特别是时间序列预测,已经成为
关系抽取是信息抽取领域的重要环节。基于远程监督的关系抽取(Distant Supervision based Relation Extaction,DSRE)是当前的研究热点,其通过远程监督获得大量训练数据,有效
随着计算机技术与移动通信技术的快速发展与推广,在任何时候、任何地点访问任何数据成为移动数据库技术中的迫切需求。移动数据库的研究已经受到越来越多研究人员的关注而成为
信息在社会生活中的地位和作用越来越重要,是社会发展的重要战略资源。随着计算机网络和通信系统的发展,信息实现了共享。信息技术改变着人们的生活和工作方式。与此同时人们
随着网络技术的迅速发展,网络规模的日趋庞大和复杂以及网络应用类型的多样化,传统的网络管理已不能满足用户对QoS的更高要求。由于网络流量特征是网络性能分析、网络拓扑结
随着网络通信、计算机技术的迅速发展,网络上传播的音视频、电子书、图片和软件等数字产品已经融入人们的日常生活。这些数字产品有着传播速度快、易复制和易分发等特点。因