主题模型在论文推荐系统中的应用研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:HUZHAOHUA333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的快速发展,科技论文的规模在快速增长,为科研工作者带来了丰富的文献资料。据统计,高校论文数量以每年6%-8%的速度在增长,规模已达千万级,用户搜索感兴趣论文的时间也与日俱增。在此背景下,论文推荐系统应运而生,传统的论文推荐系统基于论文元数据或向量空间模型进行,存在无法解决语义和效率低下的问题,推荐效果不理想。为了解决该问题,本文将主题模型应用于论文推荐系统中,并给出改进的用户兴趣模型算法。本文的主要工作如下:1.对主题模型和论文推荐系统的相关理论和研究现状进行了分析,研究分析了主题模型应用在论文推荐系统中的可行性。2.给出了一种新的用户兴趣模型算法TV-IPF,该算法增加了在用户兴趣论文列表中出现次数少、权值大的主题在用户兴趣模型中的权值,同时不会降低出现在较多兴趣论文中的主题的权值。与传统的均值方法相比,基于改进算法得出的用户兴趣模型和相应的推荐结果更符合用户的真实需求。3.设计并实现了基于主题模型的推荐系统,检验了主题模型解决语义问题的能力,研究了在新的用户模型算法下稀疏度、推荐数量对推荐性能的影响。此外,分析了主题模型和协同过滤算法的优缺点,给出了两者的混合推荐系统,依据稀疏度来决定两者在推荐结果中的比例。该混合推荐系统在评分矩阵稀疏时也能够给出准确推荐,同时能够适当的提高推荐系统的多样性。实验表明,本文给出的论文推荐方法提高了推荐系统的召回率和多样性。
其他文献
随着网络技术的发展,嵌入式技术和网络技术的结合是大势所趋。然而,就目前而言,嵌入式设备大多采用无线网络接入的方式,无线网络具有低带宽、高延时、易断线等缺点,无法适应信息化
神经网络是功能强大的数据建模工具,已成功应用于求解分类问题和回归问题。结构选择是神经网络研究的热点之一,针对具体问题,选择合适的网络结构对提高网络训练的速度、增强网络
基于双目视觉的线段长度测量是一种非接触式测量技术,具有效率高、精度高、非损伤性等特点,在工业测量中具有广泛的应用前景。但在实际应用中,在各个步骤中的误差累积会影响
数以万计的门户网站、搜索引擎可实现Web信息发布、浏览、查询和检索等功能,然而,越来越多的用户希望能够有对Web信息进行内容分析、数据挖掘和数据处理,从而智能地“提炼”出与
目前的应用系统软件,多数分为Fat Client和Thin Client。Fat Client具有丰富的接口、易开发、反应时间快;但软件需要在客户端执行,大量部署和未来更新上有很大的困难;Thin Client
运动估计是视频编码器的重要组成部分,占整个压缩编码50%以上的计算量。而块匹配搜索又是运动估计的核心,全局搜索算法由于运算复杂度较大,没有实用价值,为了降低搜索量,科研人员提
传统的网络采用尽力而为模式处理到达业务流,无法对要求服务质量的业务提供有效支持。一些研究者和服务提供者一直在寻求解决这一缺陷的途径,其中集成服务和区分服务这两类服务
电子商务的迅速发展使得支付方式发生了巨大的变革,现代化的支付工具——电子现金应运而生并日益发展,由此对现代支付体系也提出更高的要求。但是现在电子现金中还有撤销成员、
优美图是图论中极有趣的研究课题之一,而Skolem优美图是由优美图衍生出来的一个变种。Skolem优美图的研究始于1991年Lee的一篇论文,在这篇论文中,Lee明确给出了Skolem优美图的定
知识管理是90年代中期以后出现的,作为一种新的管理形式,已成为企业提升竞争力的核心要素。国内从1998年以来引入知识管理概念,并受到广泛关注,知识管理逐渐成为管理领域研究的热