基于Web日志挖掘的个性化学习资源推荐模型研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:dengxiaofei317
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:针对传统网络学习系统存在的不足,该文基于个性化推荐技术和Web日志挖掘技术,提出了一种新的个性化学习资源推荐模型。该模型通过分析和研究网络学习行为的特点,挖掘并分析出不同学习者的学习特征,实现了在线学习的个性化推荐,有效地提高了学习质量和学习效果。
  关键词:Web日志挖掘;个性化推荐;网络学习模型
  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)23-0023-02
  Abstract: Focused on the shortcomings of the traditional network learning system, this paper proposes a personalized learning resources recommended model. Based on the personalized recommendation technology and Web log mining technology , the model searches the different learning characteristics of the users through analyzing their learning behaviors in the network, and then generates the personalized recommendation for the online learning, This recommendation model can effectively improve the quality and effect of learning .
  Key words: Web log mining; personalized recommendation; network learning model
  1 引言
  当前,随着网络技術和信息技术的飞速发展,社会各领域与互联网的联系越来越紧密,不断地影响和改变着人们的生活方式和学习方式。网络在线学习作为一种全新的知识传递模式和学习方式,从早期的网络学习平台,到如今风靡全球的 MOOC网站的兴起——国外的Coursera、Udacity、edX等在线课程提供商,国内清华大学的学堂在线和网易的中国大学MOOC等,都让学习者能够不受时空限制、随时随地系统深入地学习,越来越受到人们的欢迎。
  网络学习的快速发展也使得一些问题逐渐浮现,传统网络教学平台没有考虑学习者学习需求、学习风格等个体差异,提供给学习者的学习资源千篇一律,本文利用Web日志挖掘技术,根据学习者访问网络学习平台保留的日志记录,挖掘并分析出不同学习者的初始能力、学习兴趣、学习风格、学习路径等特征,设计出个性化的学习资源推荐模型,为学习者提供更符合学习需求的资源,将提升其学习效率和学习效果,尽可能做到因材施教。
  2 Web日志挖掘
  在信息时代,数据就是财富。因特网中的数据更是呈指数级暴增,怎样在这样庞大的数据集合里挖掘出有价值的信息已经成为数据挖掘的研究热点。但是Web站点中的数据具有数据量庞大,信息源动态强,数据异构或半结构化等特点,传统的数据挖掘很难应对。Web挖掘是数据挖掘技术的应用与延伸,是利用数据挖掘、文本挖掘、机器学习等技术从Web页面数据、日志数据、超链接关系中发现感兴趣的、潜在的、有用的规则、模式、领域知识等[1]。根据挖掘中使用的数据类型,Web挖掘一般可分为三类:内容挖掘(Web Content Mining)、结构挖掘(Web Structure Mining)和使用挖掘(Web Usage Mining) [2]。
  Web日志挖掘属于Web使用挖掘的一种,主要根据用户在访问系统留下的日志文件,提取Web日志中的有效信息,结合用户的背景、兴趣等,为用户提供个性化的推荐服务,帮助优化改善站点结构,使得系统效率得以大幅改善。在网络教育中,通过对学习者访问Web站点的信息进行挖掘,可以实现按知识点对网络课程内容进行分类,还可以获取学习者的访问方式、访问行为和访问序列等有关信息,挖掘并分析出学习者的个性特征,既满足了学习者对知识的需求,又可以向教师或网络课程制作者提供网络课程的改进意见[3]。
  雁过留声,学习者在访问Web站点时,会留下很多宝贵的数据信息。这些信息主要包括了学习者的IP地址、访问时间、用户名、访问出错信息等。这些数据信息大都包含在Web服务器的各种日志文件中[4]。收集到的日志文件有相当比例的是无用的或者不正确的数据,需要进行数据清洗转换、用户识别、用户会话识别、访问路径补全等数据预处理操作,得到适合挖掘的结构化会话数据。然后利用统计分析、关联规则、序列模式、聚类与分类等挖掘技术得到数据背后隐藏的有用模式集合。最后一步是模式分析,根据数据预处理和模式识别的结果,对数据做进一步的分析,提取有价值的规则集合,即用户的个性特征,并将其可视化。具体流程如图1所示。
  3 个性化学习资源推荐模型设计
  基于Web日志挖掘的个性化学习资源推荐系统,利用Web日志挖掘技术和个性化推荐技术,在传统网络在线学习系统的基础上设计了相应模块,使得该学习系统能够对Web服务器上学习者的访问日志进行Web访问信息挖掘,挖掘并分析出学习者的访问序列,从而根据学习者的学习特征、学习行为和学习轨迹等分析和考虑学习者的学习风格、学习习惯和学习兴趣等,而不是仅仅考虑认知水平和学习进度,对学习者的后续学习行为及目标知识进行合理预测和个性化推荐,更好地提供个性化学习服务,发挥系统的社会价值,有利于形成终身学习的学习型社会。
  本系统主要由六个模块组成:登录模块、Web日志挖掘处理模块、知识库、个性化推荐模块、常规功能模块和学习资源库,如图2所示。用户登录时必须首先注册,并认真填写系统管理员设计的调查问卷,生成用户个性化信息资料,建立初始用户对资源的兴趣矩阵,避免出现系统冷启动问题。该系统中有传统在线学习系统具有的功能,如用户管理、学习资源管理、在线测试、网上答疑和教学评价等,同时该系统中也包含了一个核心的个性化的智能模块——Web日志挖掘处理模块,以实现对学习者和页面的聚类及学习者学习规律、学习风格的分析。当用户访问系统时,该模块主要完成以下两方面操作:第一,利用K-Means聚类算法进行分析,根据学习者和页面两种对象根据它们之间的相似度分为若干小组,相似对象构成一组。如发现某些页面属于同一小组,可在学习者访问其中页面时将本组其他页面推荐给学习者。同时,同一组学习者一般具有相似的学习特征,可对同组学习者提供相同的个性化推荐服务。第二,利用Apriori算法进行关联规则发现。在数据预处理模块中,提取了学习者访问的页面路径序列,利用关联规则挖掘,可以得到学习者访问请求的关联规则,发掘学习者具有潜在兴趣的知识点之间的关联,并实时地推送给学生。例如,学生访问了页面A后,又访问页面B,如果完成此类操作的学生数量超过预设的值时,系统即认为页面A与页面B之间存在关联。以后学生在访问页面A时,系统就会自动地提供指向页面B的链接[5]。经过这两步的操作,不仅可以达到为学习者推荐符合其学习特征的个性化学习资源目的,还可以动态监测学习者学习兴趣和记录学习轨迹,以便及时采取合理的推荐策略,调整推荐学习内容,更好地突出学习者的主体地位,为学习者提供个性化特征服务。
  4 结语
  本文在传统网络在线学习系统基础上,利用Web日志挖掘技术,构建了个性化学习资源推荐模型。本系统改变了传统的教学模式和教学方法,使得学生会根据自己的学习兴趣选择学习内容自行在线学习,在一定程度上达到了因材施教,按需学习的效果,同时也有利于改善在线学习系统的设计以及建立个性化的学习站点,有效提高了学习质量和学习效果,帮助学生更好地学习,有利于形成终身学习的学习型社会。
  参考文献:
  [1] 张琰,王强,安萍.基于Web文本挖掘相关技术的研究[J]. 科协论坛, 2012(9):83-84.
  [2] Yoon Ho Cho,Jae Kyeong Kim. Application of Web usage mining and product taxonomy to collaborative recommendations in e-commerce[J]. Expert Systems With Applications,2004,26(2).
  [3] 赵德伟,高江锦,徐正巧. 基于K-means算法的Web日志挖掘在移动学习中的实现[J].电脑编程技巧与维护, 2012(16):92-94.
  [4] 肖建琼.WEB日志挖掘在个性化网络课程设计中的应用[J].福建电脑, 2007(1):148-149.
  [5] 徐怡,徐汀荣.基于Web日志挖掘的个性化教育系统的研究与实现[J].福建电脑,2009, 25(6):90-90.
  【通联编辑:代影】
其他文献
摘要:在大数据时代下,计算机信息特点发生了巨变,所以我们必须在计算机信息处理技术方面,切实加强对其的优化和完善,才能更好地达到处理计算机信息的目的。因而该文正是基于这一背景,从大数据时代下强化计算机信息处理的基本要求分析入手,并就大数据时代下强化计算机信息处理的几点处理技术进行了分析,以更好地促进计算机信息处理水平的提升和优化。  关键词:大数据时代;计算机信息处理技术;发展  中图分类号:TP3
摘要:随着国民生活水平的不断提高,人们对驾驶行为安全性的关注度也越来越高。通过采集行车数据,论文提出基于大数据分析方法,针对驾驶行为安全方面,设计并实现一套驾驶行为分析系统。测试表明该系统能有效实现对驾驶行为的分析和预警功能。  关键词:大数据;驾驶行为;分析系统  中图分类号:TP312 文献标识码:A 文章编号:1009-3044(2018)23-0003-02  目前,美国、日本、欧洲等国家
房屋的建筑质量关乎很多方面,对于房屋建筑的抗震性要求,也是提高建筑质量的体现.所以,如何达到建筑的抗震性要求,这条道路任重而道远.全面的深化对建筑抗震性重要性的认识,
大数据的发展引发了多业务传输需求,对于网络传输也提出了越发严格的要求,在这种情况下,传统网络传输模式无法满足实际需要,必须做好传输技术的创新.本文从IPRAN技术出发,对
摘要:该文介绍了数据库的概念及特点,以及数据库设计中的规范化,并详细介绍了数据库范式的定义及使用,介绍了在数据库范式在数据库设计中的重要性。  关键词:数据库;数据库特点;数据库范式  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)23-0010-02  数据库技术是研究数据库结构、存储、设计和使用的一门软件科学,是进行数据管理和处理的技术。随着互联网 时代的到来
本文指出了桥梁裂缝的产生与砼的性能有着密切的联系,对由砼性能所可能引起的桥梁裂缝的种类和产生的原因作了较全面的分析、总结,以方便设计、施工中找出控制裂缝的可行办法
摘要:针对高校学生信息量大,文件归不断档存储,结构越来越复杂,难以调整、维护的问题,提出基于云平台的信息仓库系统,使用云端文件仓库式的存储,不负担永久保存和索引文件的义务,文件的保存、索引、共享全部交由文件仓库管理负责,同时鉴别、过滤垃圾文件,具有更高效的检索引擎功能。  关键词:云平台;文件存储;信息仓库  中图分类号:TP391.4 文献标识码: A 文章编号:1009-3044(2018)2
春节前夕,本刊记者走访了全国几个重点城市的汽车交易市场,对汽车经销商以及诸多购车,看车的顾客进行了实地调查采访.普遍看来,在中国人最看重的节日--春节的影响下,车市有着
摘要:自国家在发布“教育信息化十年发展规划(2011-2020年)以来,根据信息化教学的需求,教学资源建设取得了丰硕的成果,并为教学资源共享提供坚实的基础。针对教学资源建设过程中存在的问题进行分析,提出了相应的对策,为教学资源建设提供合理的方案。  关键词:信息化;教学资源;对策  中文分类号:G203 文献标识码:A 文章编号:1009-3044(2018)23-0021-02  国家在发布“教
在进行建筑主体的操作中,混凝土模块的技艺在其中起着极为重要的作用.为了使该项技能能够得到更大程度的施展,该文针对混凝土模块技能在建筑主体的操作优点、运用技能重点以