论文部分内容阅读
教育信息化的发展使学习者的学习方式从传统的课堂学习转变成在线学习。在教育大数据的发展下,教学资源呈现出资源海量、信息过载且质量良莠不齐的特征,学习者在这种环境下面临着“信息过载”和“知识迷航”的问题。个性化推荐系统是解决“信息过载”的一种有效方法。推荐系统根据学习者的历史行为挖掘学习者潜在的兴趣偏好,计算学习者与资源的相似度,向学习者推荐其可能感兴趣的教学资源。在目前的个性化教学资源推荐方法的研究中,研究者着重于学习者特征建模和资源属性建模,通过计算学习者与资源之间的相似度进行推荐。这类推荐算法更倾向于向学习者推荐与其偏好相似的资源,而没有考虑到教学资源之间的逻辑关系。学习者的学习过程有着循序渐进、知识由浅到深的特点,教学资源中包含的知识点之间有着丰富的逻辑关系,因此考虑资源包含的知识点间的关系来进行个性化资源推荐是非常有必要的。基于上述思考,本文构建了一个机器学习领域小范围知识图谱,并在此基础上提出了一种融合知识连接度和学习者兴趣的基于知识图谱的教学资源推荐算法。本文的主要工作如下:(1)使用Python语言编写网络爬虫爬取了豆瓣图书上标签为“机器学习”的所有书籍信息以及与其相关的交互行为数据作为本研究的数据集;(2)使用数据集中的中文目录文本数据构建机器学习领域小范围知识图谱。在知识图谱的构建过程中,我们首先使用词频分析和基于神经网络模型(BILSTM+CRF)结合人工筛选的方式完成了对知识面实体和知识点实体的实体识别工作。其次,根据目录文本的层级关系,采用基于模板的方式对实体进行了关系抽取。最后,我们使用neo4j图数据库将获取的实体与关系信息进行了存储,完成了知识图谱的构建。(3)在构建好的知识图谱的基础上,我们提出了一种融合学习者兴趣和知识连接度的协同过滤推荐算法。在该算法的模型设计中,详细定义了知识连接度和学习者兴趣并给出了详细的推荐流程。针对提出的推荐算法中存在的用户“冷启动”问题,我们给出了一种为初学者(新用户)推荐教学资源的推荐策略。(4)为了验证提出的推荐算法的有效性,我们采用离线实验对推荐算法进行测评并对实验结果进行了分析。实验结果表明,相比于传统的userCF和itemCF,本文提出的算法在准确率、召回率、Fl-score等指标上都有所提升。本文的创新点在于:(1)构建了机器学习领域小范围知识图谱。利用该知识图谱可以为学习者展示知识点间的关系以及相关学习路径,缓解“知识迷航”的问题;(2)提出了一个融合学习者兴趣和知识连接度的协同过滤推荐算法。该算法不仅考虑了学习者兴趣,更考虑了学习者的认知水平以及知识点间的逻辑关系,产生的推荐结果更加符合学习者的学习需求;(3)提出的推荐方法不受限于新资源的交互行为,在一定程度上可以缓解推荐系统中的资源“冷启动”问题。