科研文献开放获取系统中的推荐算法研究与应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hanlu198723620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着开放获取在科研领域的发展,科研工作者们越来越习惯通过网络来进行文献获取和学术交流。如何在科研文献数量呈现爆炸式增长的情况下,为用户提供方便快捷的论文获取方式,成为了新的科研环境下开放获取系统面临的巨大挑战。论文推荐和专家推荐功能的引入能够为用户的论文发现和专家发现提供新的途径。传统的推荐方法多是以基于内容的算法为主,而随着开放获取系统的发展,加入对收集的用户行为数据的分析必将能增强系统的推荐效果。在这种情况下,传统单一的推荐算法将无法满足越来越多样化的用户需求,需要针对科研文献开放获取系统的独特应用场景进行创新和改进。本文在对传统推荐算法进行了充分研究的基础上,提出了一种将基于协同过滤的推荐算法与基于内容的推荐算法结合的混合论文推荐算法。算法首先使用词向量进行了论文内容的比较,然后使用最近邻模型进行用户行为的比较,最后将论文内容以及用户行为对推荐结果的影响进行了综合考虑,以得到最终的推荐结果。在论文推荐的基础上,我们又研究实现了专家推荐算法,通过对专家间论文内容相似度的比较,来进行专家相似度的计算以及相关专家的推荐。为了验证本文算法的有效性,我们在公开数据集上将该混合算法与多种传统推荐算法进行了对比,结果证明混合推荐算法在多种情况下都能有稳定良好的表现,且与对比算法相比推荐效果有所提升。另外,我们在基金委开放获取系统中设计并实现了论文推荐和专家推荐的功能,其实现所采用的方法是基于本文算法的部分内容,最后还实现了系统中论文成果录入的功能,经测试系统运行效果良好。
其他文献
移动自组网是在不需要预先部署任何基础设施的情况下,无线终端以随机的方式构成的一种分布式自组织网络环境,其本身的随机移动和动态拓扑特性给研究工作带来了新的挑战。解决
在自然科学和工程应用领域中存在大量约束优化问题,这些约束优化问题因常常含有多种不同类型的非线性约束条件、多模目标函数以及凹可行域而变得非常复杂。因此,对约束优化问
WSN节点一般部署在较为恶劣的环境中工作,由于不间断电源无法直接送达,网络中的节点大部分采用电池供电,节点一旦部署投入使用便很难再更换电池。在电池技术还没有获得突破性进
随着网民规模的不断扩大,网络环境和信息的安全问题也日益严重。域名系统DNS(Domain Name System的简称)作为保证整个互联网正常运行的网络基础设施,它的安全问题尤为重要。
近年来,车载自组网(Vehicular Ad Hoc Networks,VANETs)快速发展,其作为移动自组网(Mobile Ad Hoc Networks,MANETs)的一个特类,将车辆视作移动网络中的通信节点,用于节点之间以及
随着现代通信、计算机和传感器技术的迅速发展,具有感知、计算和通信能力的无线传感器网络(wireless sensor networks,WSN)应运而生。作为一种典型的普适计算的应用,WSN是大规模
随着计算机互联网技术和软件技术的发展,分布式应用越来越多,Web服务是当前构造分布式应用的标准框架。特别是SOA(面向服务的体系结构),云计算等技术的迅速发展,越来越多的企
Ad hoc网络是一个由具有无线通信功能的节点组成的多跳无线网络,由于其独有的自组织特性,使得Ad hoc网络适合需要临时架构网络的场所,在军事和民用等领域具有很大发展前景。  
求解2个给定的系统发生树的最大一致森林问题在计算生物学上是一个非常重要的NP-难问题。系统发生树包括了有根和无根2种情况。本文主要研究无根多叉系统发生树。生物方面:最
延迟容忍网络(DTN)是一种端到端之间缺乏持续可靠连接、低数据率、链路高延迟的网络,同时也是一种资源受限型网络。节点以“存储—携带—转发”的形式转发数据,数据在网络中