论文部分内容阅读
认知科学是一个探究信息在人脑中表示和转换的前沿性尖端学科。作为当前科学研究的热点,大量的相关科技文献被公开发表。在Pubmed上检索关键词cognitive,返回的文献数量达到287754篇。爆炸式增长的文献数量所带来的信息过载问题,使得科研人员难以快速找到真正需要的文献,个性化文献推荐成为一项非常有价值的研究工作。认知科学也是一门高度交叉的学科,其研究内容涉及心理学、人工智能、哲学、社会学等多个研究领域,采用行为实验、脑成像、计算建模、各种神经生物学方法等多样化的研究手段。高度的学科融合带来“知识过载”,导致认知科学领域文献具有术语更新快、跨领域词义多样化、词形结构复杂、平台开放难以获取用户个人信息及历史行为等特性,使得传统基于内容和基于协同过滤的推荐方法难以有效发挥作用。当然,认知科学领域仍有一些优点,比如外部数据集丰富,这就为推荐方法提供了一定的研究基础。 针对上述情况,本文对现有外部数据集进行丰富整合,融合时间遗忘曲线、激活扩散理论等技术并结合两种相似性计算方法,提出了一种面向认知科学领域的知识驱动的科技文献推荐方法,取得了以下研究成果: 1.构建基于“概念网格-概念词簇-背景知识库”的多维认知知识图谱,从近义词以及背景知识角度,完善现有数据脑本体以解决术语跨领域性导致的一词多义问题。 2.提出了一种基于知识驱动的建模方法,在改进的知识图谱基础上,引入时间遗忘曲线与改进的激活扩散理论对用户知识进行建模,并融合主题的背景事实,进行文献建模。该方法的提出能够有效解决传统文献推荐方法主题间语义关系缺失、生僻术语导致数据稀疏等问题,从而有效提升用户和文献建模的准确性,为实现个性化的文献推荐奠定模型基础。 3.融合知识相关度和知识距离,提出了基于知识图谱的相似性计算方法。与传统基于向量空间模型中的余弦相似性计算方法相比,该方法对模型维度没有强制性匹配的要求,能进一步缓解数据稀疏性问题。此外,本文提出的方法丰富了推荐结果,解决传统推荐结果过于单一的问题,兼顾共性和差异性,提升了推荐结果的准确性和拓展性。