论文部分内容阅读
科技论文的快速增长给知识寻求者和知识提供者同时带来了严重的信息过载问题。借助信息技术的不断发展去缓解学术信息过载问题,进而促进科研知识的分享与发现已经成为了目前研究的热点问题。过往大量的研究集中于从知识寻求者的角度来解决信息过载问题,试图基于知识寻求者发表的论文等信息去给知识寻求者推荐最相似的文献。然而尚未有研究尝试从知识提供者的角度来解决知识分享的问题。在科学研究的实际情况中,知识提供者只能通过有限的线下真实场景去分享其文章,大量的科技论文在发表之后缺乏分享给知识寻求者的机会,只能被动地等待被搜索引擎检索,因此现实中依然存在大量的科技论文无法被发现和阅读。科研社交网站的兴起给科研人员提供了一个新的知识分享与发现的平台。知识提供者可以在线上免费上载和分享其文章给其他用户,但是在拥有数百万用户的科研社交网站上去识别和发现对其论文感兴趣的知识寻求者依然是个挑战,目前还没有研究从知识提供者的视角探讨如何设计有效的学术知识分享系统。以往研究存在四点局限性:第一,现有研究缺乏从技术角度去设计一个适用于真实科研社交网络的基于知识提供者的学术知识分享的框架;第二,过往关于知识分享的研究关注于组织内部的知识分享,忽视了科研领域情境下对于开放的社交平台上的知识分享缺乏探讨;第三,以往在科研领域的推荐系统设计中仅基于兴趣的相似性设计推荐系统,忽视了不同学术知识分享情境下的策略差异;第四,在对科研社交网站上的用户研究兴趣模型构建中忽视了短期社交行为的捕捉,进而导致推荐的及时性和准确性不足;在用户科研质量的维度构建中仅采用绝对值评估,忽视了学科和期刊之间知识分享时的相对质量差异,不适用于学术知识分享的情境。基于本文识别到的研究局限和空白,本文首先设计了一个通用的学术知识分享框架来帮助知识提供者在科研社交网络上分享其论文给感兴趣的知识寻求者,本文提出的方法把科研人员层面的分析和文本层面的分析结合到一个整体推荐模型中发挥作用。在科研人员层面的分析中包括研究话题,社交关系和科研质量三个维度;在文本层面的分析中包括抽取自论文的长期研究兴趣和引入的社交行为表示的短期研究兴趣。其次根据知识分享的需求不同,本文构建了两个具体的知识分享推荐策略来解决科研社交网络上的学术知识分享困境。对于知识提供者意图分享给和自身的研究兴趣相似的知识寻求者的需求,本文提出了一个基于相似性的学术知识推荐方法来提升知识分享的深度。对于知识提供者意图分享给和自身的研究兴趣具有相关性的需求,本文提出了一个基于相关性的学术知识推荐方法来提升知识分享的广度。实验结果证明,本文提出的方法在准确性,平均精度均值,平均评分和标准化贴现累计收益四个指标上都显著优于其他基准方法。最后,本文提出的学术知识分享推荐方法目前已经被部署在科研之友平台上。本文的研究具有以下的创新点:第一,本文从知识提供者的角度设计学术知识分享方法协助其利用推荐系统有效分享其个人论文给潜在的知识寻求者,解决了知识提供者主动分享知识的技术难题,为后续的研究提供了新的视角;第二,该研究通过设计基于科研社交网络的知识分享推荐系统,证实了学术知识推荐系统能够有效提高知识分享的接受率和满意度。丰富了 IT系统对于知识分享的促进不仅限于被动提供用户交流平台,智能推荐系统可以主动促进知识分享,证明了其在知识分享的重要性,也为后续设计更智能的系统来主动促进知识提供了视角;第三,本文提出了一个适用于不同知识分享策略的通用知识分享框架,该框架将科研人员层面的分析和文本层面的分析整合到一个模型中。补充了推荐系统设计中仅考虑单一层面分析的不足,而且通过两步骤的框架设计,可以减少海量的计算量,具备了部署在大型真实科研社交网络上的能力。同时所提出的通用学术知识分享框架可以适用于不同的知识分享策略,具有较强的适用性;第四,在具体的模型设计中,本文在科研质量维度中引入科研质量的相对性指标有效解决了单一静态指标带来的不匹配现象,该研究了提高了科研质量在科研领域知识管理中的重要性和有价值的认知。在文本分析层面,通过捕捉用户的社交行为数据,平衡长期和短期研究兴趣,可以有效解决新用户的冷启动问题并且提高推荐系统性能。