论文部分内容阅读
脑信息学是一门融合网络智能、认知科学、神经科学的前沿交叉学科,主要通过系统化的方法论,用精密的实验设备和实验设计获取多样化的人脑数据,用先进的分析工具和算法挖掘分析数据,用长期、全局的观点来研究人脑信息加工机制,最终实现对人类智能的深刻理解。脑信息学属于“数据驱动”型的学科,构建脑信息源知识图谱可以对多样化的脑数据进行系统化地管理,对非结构化的领域知识进行结构化的描述,从而更好地支持脑信息学的可持续化研究。然而随着对人脑认知功能的深入研究,越来越多的实验设计范式、人脑原始数据、科研文献成果被积累下来,导致信息库目前面临一些问题:首先是知识图谱的覆盖率问题。现有的脑信息源知识图谱中没有完全覆盖一些实验信息、新的实体等,因此尚待完善;其次是信息过载下的文献检索问题。在不同的研究阶段,研究人员需要不同的领域文献辅助其进行知识调研、研究方向拓展、研究结果论证等,如何准确高效地向研究人员推荐符合研究兴趣的文献是一个重要的研究课题。本文在此背景下展开研究,取得了以下研究成果: 1.提出了基于领域相关性度量的概念抽取算法,在领域区分度中对先前研究中的两种假设进行了改进,使用领域关联函数解决了普通词组被误判为领域概念的问题。实验证明,与其他算法相比,该算法能够改善细化领域下特定类目的概念抽取准确率较低的问题,能够更准确地从科技文献中抽取出脑信息源知识图谱中的概念。 2.改进了基于领域知识的研究者兴趣模型构建方法,并提出了基于脑信息源知识图谱的模型扩展方法。在用户兴趣建模中,笔者在保持兴趣的计算方面考虑了用户发表文献之间的级别差异性对其研究偏好的影响;此外,还构建了领域关联模型,用于在脑信息源知识图谱上对用户的研究领域进行推理扩展,以挖掘其他相关领域的潜在兴趣偏好。 3.提出了基于知识图谱的个性化文献推荐算法。该算法融合脑信息学领域知识,并在推荐对象建模中引入了语义相似度,为文章的特征化增加了语义信息,同时改善了由向量空间模型带来的数据稀疏问题。实验表明本文的算法能够准确地获取用户研究兴趣,从而为其推荐符合兴趣偏好的科技文献。此外,基于领域关联模型的二次推荐算法,可以为用户提供多样化的文献推荐服务,拓宽用户的研究视野。