面向学术文献的信息推荐技术的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:dengxiaofei317
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向学术文献的信息推荐技术具有很好的实用性,能帮助研究人员减轻信息过载所带来的负担。根据美国科学基金预测,2014年全球发表的论文将达到一百六十四万篇。面向学术文献的信息推荐技术能够帮助研究人员从海量论文中便捷地找到对其有用的论文。  面向学术文献的信息推荐技术可以归为两大类,一类是论文推荐,另一类是引用文献推荐。前者根据用户的浏览记录、个人档案等信息推测出用户兴趣,向其推荐论文;后者是指,给定一篇论文或论文中的一段文本,推荐与该论文或该段文本匹配的引用文献。本文对上述两类学术文献推荐任务进行了研究,即论文推荐和引用文献推荐,分别提出了利用阅读顺序信息的论文推荐算法和跨语言的上下文感知引用文献推荐算法。  在论文推荐任务中,常见的方法是通过用户的浏览记录来推测用户兴趣。对于这个任务,目前的算法大多是基于协同过滤的框架,简单地将阅读记录看成无序的,而忽略了阅读顺序中所蕴含的论文之间的关系。针对上述问题,本文提出了一种利用阅读顺序的论文推荐算法。该算法以基于矩阵分解的协同过滤算法为基础,在优化目标中加入反映论文关系的约束项。该算法既能够很好地利用论文之间的关联关系,同时又保持了基于矩阵分解的协同过滤算法的优点。为了计算论文之间的关联度,本文提出了一种基于用户阅读顺序的论文关联度计算方法。在真实数据集上的实验结果表明,本文提出的算法能够取得更加优异的性能。  对于引用文献推荐任务,本文关注给定一段文本,为其推荐匹配的引用文献的情形,即上下文感知的引用文献推荐。现有的算法只适用于单语言环境。但是在实际中,跨语言文献引用是非常普遍的。本文定义了一个新颖的任务——跨语言的上下文感知引用文献推荐。针对这个任务,本文提出了一个利用双语隐式语义空间的上下文感知引用文献推荐算法(BLSRec-Ⅰ),该算法可以为不同语言中的上下文文本和引用文献内容学习一个共有的隐式低维空间,并在该隐式空间中计算上下文与引用文献的关联度。在这个算法基础上,本文进一步利用双语语料和论文摘要信息对BLSRec-Ⅰ进行了扩展,分别得到BLSRec-Ⅱ和BLSRec-Ⅲ两个模型。通过在真实数据集上的验证,本文提出的算法可以取得比基准算法更好的性能。
其他文献
该课题的主要目的是面对移动互联技术的新发展方向,研究企业内部信息如何由INTERNET和INTRANET向移动无线网迁移,如何实现信息可访问域在空间上的扩展.研究移动互联时代的新
该文研究的分类技术是决策树,而分类在数据挖掘中是一项非常重要的任务.作者将粗糙集和C4.5决策树构造算法结合起来,提出了一种新型的算法.对于仅有离散值属性的情况下,利用
随着INTERNET的快速发展,计算机网络犯罪的增多已经威胁到国家和政府的安全。如何在不涉及个人隐私的情况下对网络信息流进行安全监控,是各国政府现在重点研究的课题之一。本文
随着市场环境的不断改变,银行同业之间的业务竞争变的越来越剧烈,采用IC卡替代磁条卡作为新型的电子支付方式已经成为商业银行提升业务竞争力、争夺市场的重要手段.该文通过
当今社会能源的供给与人类的需求之间的矛盾已然成为阻碍科学技术发展的关键因素,与此同时由于人类大量开采传统能源造成了大气和环境污染,使得人类生存环境不断恶化。据此,近年来作为替代传统能源的新型能源得到了快速发展,其中太阳能就是典型代表。光伏发电中逆变器是重要组成部分,伴随着PWM逆变器日益广泛运用的今天,电力电子装置所产生的谐波已然成为最大的干扰源,而PWM逆变器输出波形中谐波含量较高。高次谐波抑制
高速计算机网络和不断提高的微处理芯片性能使得计算机网络成为吸引人的并行计算载体。仅依赖于商业化的硬件和软件,计算机网络能够提供高性价比、高可用性的计算。这种高性能
首先,受到Lars Rasmusson在1996年提出的,通过模拟"社会控制"来提供安全Internet商务思想的启发,该文采用通过将服务组织成一种自由开放的联盟的形式,来实现对服务信息的采集
“超流水”和“超标量”设计是提升单个微处理器核心之性能的主要手段。但是,随着流水线级数的加深或者每个时钟周期发射的指令数增多,分支指令跳转引发的额外开销也加增,导致平
目前网络安全问题日益突出,然而传统的网络安全防护技术由于功能分散,缺少统一的管理调度机制,无法为当前分布式的网络系统提供安全保障。网络安全态势感知研究融合了传统的网络
该论文阐述了Microsoft.NET环境的体系结构和建立在此基础之上的电子商务开发技术,使用全新的面向对象语言C#,结合ASP.NET,运用Web服务,设计和实现了基于图书零售业的电子商务