基于知识脉络的科技论文推荐

来源 :山西大学 | 被引量 : 1次 | 上传用户:InsideCSharp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,人们获取信息的渠道越来越多,信息爆炸问题也越来越严重。在科研领域中学术论文不但数量巨大而且领域众多,科研工作者需要花费越来越多的精力从众多的学术资源中找到感兴趣的论文,科技文献的信息爆炸问题需要得到有效解决。推荐系统是当前解决科技文献信息超载问题的有效方法。针对当前科技论文推荐算法推荐准确度不高的问题,本文提出一种基于知识脉络的科技论文推荐方法:抽取关键词及其语义关系构建知识脉络,基于知识脉络计算用户与论文之间的相似度实现对用户推荐相关科技论文。首先以科技论文中给出的关键词为核心,分别从字形构成以及语义层面上抽取了关键词之间的同义关系、上下位关系以及共现关系,并以关键词为结点、关键词之间的关系为边,构建科技论文知识脉络;然后,将论文关键词作为用户兴趣的显著标识,将用户和论文资源分别表示为关键词向量;最后,通过关键词向量间的语义相似性来衡量用户与论文之间的相似度,而关键词之间的相似性则利用其在知识脉络中语义距离来衡量,从而在知识脉络上确定用户对某篇论文的感兴趣程度,实现对用户推荐相关科技论文。该方法利用论文关键词之间的语义关联来进行推荐,推荐时不仅结合了文档内关键词的语义信息,同时考虑了文档间关键词的潜在联系。实验结果表明,该算法的推荐准确率和召回率得到明显提升。
其他文献
随着网络技术和多媒体技术的迅速发展,图像数据的安全有效传输越来越受到人们关注,数字图像压缩和加密技术应运而生。本文主要对基于小波变换的图像压缩编码算法和以混沌理论为
随着计算机技术和数据库技术的快速发展,人们采集数据的能力有了很大的提高,并积累了大量的数据。通常仅仅对这些数据做简单的查询、编辑工作,然而这些数据中隐含了大量对人
在模式识别领域,有很多问题需要获取大量的有标记数据以训练出高精度的分类器,但有标记数据的获取却是非常困难的,甚至要消耗大量的人力物力。随着数据收集和存储技术的飞速发展
近年来我国铁路事业飞速发展,行车密度与速度大幅增加,由此带来的对铁路行驶安全性与可靠性的要求也越来越高。但是,当下的线路状态检测还严重依赖于巡道工人的目测检查,这样
因特网技术的发展使得网格作为一种分布式的计算平台诞生了,它主要提供资源的共享和协同工作,这些资源包括计算资源,存储资源,信息资源,硬件资源,软件资源等等,它把网络上的
云模型是李德毅院士提出的云理论的一个核心组成部分。它是在对概率理论和模糊集合理论进行交叉渗透的基础上,通过特定的构造算子,形成定性概念与其定量表示之间的转换模型。
近几年来,随着软件产业的迅速发展,软件发展的规模越来越大,软件购买、交付及运营的费用越来越高,同时企业信息化建设需求不断增强,逐渐需要采用一种更好的软件交付模式来减
I/O调度算法对磁盘性能有着至关重要的影响。传统的磁盘调度算法主要通过优化寻道时间来提高磁盘的I/O带宽利用率,但没有考虑到单个请求的响应时间,不能满足实时性要求,也无法感
自1999年各个高校开始进行高校招生扩招以来,现有的大学校区已经不能满足日益增长的学生的数量。于是,许多学校开始扩充自己的校区,将校区的规模扩大了,许多大学选择了在郊外建立
随着当前信息技术的发展以及Internet的普及,人们对诸如自动文摘这样的文本处理需求与日俱增。中文自动文摘研究起步较晚,加上中文自身的特点导致中文自动文摘技术成熟还尚需