论文部分内容阅读
在信息严重过载的今天,推荐技术能帮助我们更便捷地获取需要的信息。推荐技术从最初的提出发展到现在,出现了一些经典的算法,例如基于内容的推荐和基于近邻的协同过滤。推荐技术如今在工业界的应用非常广泛,出现了新闻、视频、物品推荐和个性化音乐电台等推荐应用。在学术界的研究也日异月新,许多国际学术会议上都有相应的论文发表。随着学术研究的繁荣发展,学术论文的数量也在快速的增加。当用户需要在大量的文献中找到相关或感兴趣的学术文章的时候,通常是通过在搜索引擎中输入关键词进行检索,或者定期浏览相关会议和期刊网站,以了解最新收录的学术文章。但是通过关键词检索和浏览文章目录都是十分繁琐的工作,并且有时候用户很难找到合适的关键词来描述自己的需求。因此需要推荐技术来帮助用户找到他们所需要学术论文。 目前关于学术论文推荐技术的研究较少,现有的学术论文研究大多是基于对系统中用户信息进行的分析,并且主要集中在研究论文之间或论文与用户之间的相似度计算上面,并没有考虑用户对于学术论文的不同阅读目的。在本篇论文中,我们提出了利用社交网络的信息来获取用户学术兴趣点的方法,并且也提出了针对用户不同的阅读目的进行推荐的方法。利用用户社交网络中的信息可以帮助推荐系统获取更多的用户知识,本文分析用户新浪微博中的社交信息,通过用户发布、转发、评论和朋友的动态来抽取出用户的学术兴趣点。同时根据不同的阅读目的,本文还可以分别推荐给用户问题相关和方法相关的学术论文,通过将学术论文的摘要划分为问题描述和方法描述的部分,然后分别对这两个描述不同阅读目的的文本进行相似度的分析来进行推荐。 最后本文构建了学术论文的推荐系统,实现了文献检索、基于用户的个性化推荐和基于文档的相似性推荐等功能。最后我们也在基于用户的个性化推荐和基于文档的相似性推荐方面做了相应的实验,验证了本文算法的有效性。本文的学术贡献主要有以下几个方面: 本文是最早提出了利用社交信息获取用户学术兴趣点的论文,利用社交信息不但可以获得更多的用户信息,并且还可以一定程度上解决推荐系统的冷启动问题。 利用从中文期刊中抽取中文和英文关键词对的方法来解决微博和论文跨语言推荐的问题。 通过标签过滤的方法判断学术关系,系统只处理这些学术关系则可以大幅度提升性能。 提出拆分论文摘要的方法,用来区分论文所解决的问题和使用的方法,进而可以根据不同阅读目的给用户推荐论文。