论文部分内容阅读
摘要:本文介绍了个性化学习资源推荐的研究背景和意义,说明了传统教育存在的问题,阐述了协同过滤推荐技术原理、方法及在教育中的应用,并通过实验分析,发现基于该算法的个性化学习资源推荐能够有效地提高学生的学习效率。
关键词:个性化;协同过滤;用户偏好;精准推荐;学习效率
中图分类号:G434 文献标识码:A 论文编号:1674-2117(2018)20-0107-03
引言
丰富的网络资源方便用户通过检索从海量资源中寻找目标资源,它已成为人们获取目标资源的主要方式。但网络资源呈现爆炸式增长[1],给用户带来便利的同时也产生了一系列问题。例如,在面对大量的学习资料时,学习者找到符合自身需求的学习资源存在着一定的困难[2],即使找到目标资源,该资源也不一定是适合自身学习的资源。如何将海量的学习资源推荐给学习者是传统教育目前面临的挑战。
个性化学习是通过对大量的学生学习日志数据进行分析、处理、挖掘,并对挖掘的结果进行推荐,根据学习者的基础知识掌握情况、兴趣爱好、学习能力等特征来设计用于支持教学的个性化学习模式,为学习者提供个性化学习资源、学习路径。[3][4]近年来,教育技术领域专家对数据挖掘技术在教育领域的应用做了相关研究,并期望通过推荐算法实现学生学习个性化,减少学生学习的重复性,提高学习效率。例如,杨丽丽[5]提出个性化推荐算法可以帮助学生迅速找到自己偏好的学习资源。刘静等[6]提出个性化服务可以关注每位学生的不同学习需求,促进学生学习的积极性和主动性。潘志宏等[7]提出挖掘用户的学习数据能够制订更加科学的学习计划。
协同过滤推荐技术在教育中的应用
协同过滤推荐方法的主要思路是利用已有用户群过去的行为,分析预测未来有哪些用户对该类物品感兴趣。一般来说,协同过滤推荐分为三种类型,分别是基于用户(user-based)的协同过滤、基于项目(item-based)的协同过滤、基于模型(model-based)的协同过滤。基于用户的协同过滤技术的实现主要包含三个步骤,分别是找到和目标用户兴趣相似的用户集合,利用Pearson相关系数、余弦相似度、Jaccard等方法计算物品之间的相似度,可以通过采用TOP-N方式筛选出目标用户最近邻,或者通过设定阈值的方式筛选目标用户最近邻。该算法处理流程如下页图1所示。
传统的教育是通过给定的课本内容按部就班地完成学习任务,对于没有该课程基础知识的学生来说课程内容的设置可以参考通用课程设计来逐步完成基础知识学习任务。但对有一定基础的学生来说,如能够掌握信息技术课程中字处理内容的字号设置、字体设置、页面设置等基本知识,就可以不需要完全按照大纲的要求来完成学习任务的课程学习。因为该类学生掌握知识的水平程度有较大的差异,如果按部就班地完成学习任务就可能会重复学习已经掌握的内容,浪费了大量的宝贵的学习时间,不利于学习效率的提高,会影响个性化学习。因此,在学习中加入该推荐系统能够对学生的学习进行个性化引导,充分利用学生的学习时间。
为了达到个性化学习推荐的目的,可将学生分为两类,对没有基础的学生按照课程大纲要求,有序完成知识学习,通过基础知识的掌握能够更加全面地了解所学的内容。图2所示为无课程基础知识学生的学习过程。
对有知识基础的学生来说,首先通过问卷调查、交流等形式了解学生对该课程内容的掌握情况,计算该学生学习特征,并与推荐系统中数据进行比对找到与该学生学习行为类似的学生学习计划推荐给他。[8]通过捕获学生学习行为,将该行为提取并进行协同过滤推荐算法计算,计算出学生学习模型,将預测资源再反馈给学生,在一个闭环的环境中将推荐的知识发送给需要学习的学生,从而提高学生的学习效率(如图3)。
用户偏好即用户对物品的选择具有一定的倾向性。本文通过累加的方式对用户的偏好进行计算,根据用户查看物品的次数来决定,查看次数越多则表明用户越需要该方面的资料,反之则是用户对该方面的资料需求不大。
协同过滤(Collaborative Filtering)推荐算法是个性化推荐技术使用最广泛的一种技术,它能够有效解决信息过载问题。[9]在本文中,笔者利用用户对学习资源的偏好以及用户之间潜在的关系偏好,结合学习资源实现个性化推荐。
基于用户偏好协同过滤算法的个性化学习资源推荐
推荐学习资源质量越高则表明个性化学习资源的推荐技术做得越好,本文提出了基于用户偏好协同过滤算法的个性化学习资源推荐,算法实现流程如图4所示。
从图4可以看出,本方法需要解决的关键问题有:①用户偏好融合到学生-内容评分矩阵中。②利用皮尔卡森计算学生之间的相似度。
笔者用U={u1,u2,…,un}表示用户集合,用Pro={p1,p2,…,pn}代表产品集合,用R代表评分项ri,j的n*m评分矩阵,i属于1到n,j属于1到m,分值定义从1(非常不喜欢)到5(非常喜欢)。给定矩阵R,学生a和学生b相似度计算simp(a,b),计算a与b之间的相似度。例如,给出评分数矩阵R:
利用如下公式,Pearson相关系数计算学生之间的相似集,并进行推荐。
效果分析
为了验证本文实验方法的有效性,本研究以通识课程信息技术588名学生学习为例,通过学习课程资源并进行实例验证。实验选取488名学生数据作为训练数据集,100名学生数据作为测试集(其中A班50名,B班50名学生),A班按照原计划开班学习,B班在基于用户偏好协同过滤算法的个性化学习资源推荐系统中学习,并对A、B两个班学生的学习情况进行了挖掘分析。
如图5所示,横坐标表示周次,纵坐标表示以小时为单位的学习时长。
通过分析发现,在传统教育模式下学习时间相对较长,而在个性化学习资源推荐系统中学习时长相对较短。此外,笔者对A、B两个班级学生的学习效果进行了对比分析。横坐标表示周次,纵坐标表示百分制考评成绩,如图6所示。
关键词:个性化;协同过滤;用户偏好;精准推荐;学习效率
中图分类号:G434 文献标识码:A 论文编号:1674-2117(2018)20-0107-03
引言
丰富的网络资源方便用户通过检索从海量资源中寻找目标资源,它已成为人们获取目标资源的主要方式。但网络资源呈现爆炸式增长[1],给用户带来便利的同时也产生了一系列问题。例如,在面对大量的学习资料时,学习者找到符合自身需求的学习资源存在着一定的困难[2],即使找到目标资源,该资源也不一定是适合自身学习的资源。如何将海量的学习资源推荐给学习者是传统教育目前面临的挑战。
个性化学习是通过对大量的学生学习日志数据进行分析、处理、挖掘,并对挖掘的结果进行推荐,根据学习者的基础知识掌握情况、兴趣爱好、学习能力等特征来设计用于支持教学的个性化学习模式,为学习者提供个性化学习资源、学习路径。[3][4]近年来,教育技术领域专家对数据挖掘技术在教育领域的应用做了相关研究,并期望通过推荐算法实现学生学习个性化,减少学生学习的重复性,提高学习效率。例如,杨丽丽[5]提出个性化推荐算法可以帮助学生迅速找到自己偏好的学习资源。刘静等[6]提出个性化服务可以关注每位学生的不同学习需求,促进学生学习的积极性和主动性。潘志宏等[7]提出挖掘用户的学习数据能够制订更加科学的学习计划。
协同过滤推荐技术在教育中的应用
协同过滤推荐方法的主要思路是利用已有用户群过去的行为,分析预测未来有哪些用户对该类物品感兴趣。一般来说,协同过滤推荐分为三种类型,分别是基于用户(user-based)的协同过滤、基于项目(item-based)的协同过滤、基于模型(model-based)的协同过滤。基于用户的协同过滤技术的实现主要包含三个步骤,分别是找到和目标用户兴趣相似的用户集合,利用Pearson相关系数、余弦相似度、Jaccard等方法计算物品之间的相似度,可以通过采用TOP-N方式筛选出目标用户最近邻,或者通过设定阈值的方式筛选目标用户最近邻。该算法处理流程如下页图1所示。
传统的教育是通过给定的课本内容按部就班地完成学习任务,对于没有该课程基础知识的学生来说课程内容的设置可以参考通用课程设计来逐步完成基础知识学习任务。但对有一定基础的学生来说,如能够掌握信息技术课程中字处理内容的字号设置、字体设置、页面设置等基本知识,就可以不需要完全按照大纲的要求来完成学习任务的课程学习。因为该类学生掌握知识的水平程度有较大的差异,如果按部就班地完成学习任务就可能会重复学习已经掌握的内容,浪费了大量的宝贵的学习时间,不利于学习效率的提高,会影响个性化学习。因此,在学习中加入该推荐系统能够对学生的学习进行个性化引导,充分利用学生的学习时间。
为了达到个性化学习推荐的目的,可将学生分为两类,对没有基础的学生按照课程大纲要求,有序完成知识学习,通过基础知识的掌握能够更加全面地了解所学的内容。图2所示为无课程基础知识学生的学习过程。
对有知识基础的学生来说,首先通过问卷调查、交流等形式了解学生对该课程内容的掌握情况,计算该学生学习特征,并与推荐系统中数据进行比对找到与该学生学习行为类似的学生学习计划推荐给他。[8]通过捕获学生学习行为,将该行为提取并进行协同过滤推荐算法计算,计算出学生学习模型,将預测资源再反馈给学生,在一个闭环的环境中将推荐的知识发送给需要学习的学生,从而提高学生的学习效率(如图3)。
用户偏好即用户对物品的选择具有一定的倾向性。本文通过累加的方式对用户的偏好进行计算,根据用户查看物品的次数来决定,查看次数越多则表明用户越需要该方面的资料,反之则是用户对该方面的资料需求不大。
协同过滤(Collaborative Filtering)推荐算法是个性化推荐技术使用最广泛的一种技术,它能够有效解决信息过载问题。[9]在本文中,笔者利用用户对学习资源的偏好以及用户之间潜在的关系偏好,结合学习资源实现个性化推荐。
基于用户偏好协同过滤算法的个性化学习资源推荐
推荐学习资源质量越高则表明个性化学习资源的推荐技术做得越好,本文提出了基于用户偏好协同过滤算法的个性化学习资源推荐,算法实现流程如图4所示。
从图4可以看出,本方法需要解决的关键问题有:①用户偏好融合到学生-内容评分矩阵中。②利用皮尔卡森计算学生之间的相似度。
笔者用U={u1,u2,…,un}表示用户集合,用Pro={p1,p2,…,pn}代表产品集合,用R代表评分项ri,j的n*m评分矩阵,i属于1到n,j属于1到m,分值定义从1(非常不喜欢)到5(非常喜欢)。给定矩阵R,学生a和学生b相似度计算simp(a,b),计算a与b之间的相似度。例如,给出评分数矩阵R:
利用如下公式,Pearson相关系数计算学生之间的相似集,并进行推荐。
效果分析
为了验证本文实验方法的有效性,本研究以通识课程信息技术588名学生学习为例,通过学习课程资源并进行实例验证。实验选取488名学生数据作为训练数据集,100名学生数据作为测试集(其中A班50名,B班50名学生),A班按照原计划开班学习,B班在基于用户偏好协同过滤算法的个性化学习资源推荐系统中学习,并对A、B两个班学生的学习情况进行了挖掘分析。
如图5所示,横坐标表示周次,纵坐标表示以小时为单位的学习时长。
通过分析发现,在传统教育模式下学习时间相对较长,而在个性化学习资源推荐系统中学习时长相对较短。此外,笔者对A、B两个班级学生的学习效果进行了对比分析。横坐标表示周次,纵坐标表示百分制考评成绩,如图6所示。