基于数据挖掘的智能性个性化网络学习系统设计

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:seijxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:目前基于web的学习系统已经不能满足不同背景的学习者在不同时间、以不同目的、不同方式的学习需求。本文在利用以知识点为导向的数据挖掘技术,运用多种数据挖掘算法,构建一种智能化的个性化网络学习系统用以满足对学习者有针对性的教育需求,提高教学质量。
  关键词:远程教育;数据挖掘;个性化学习系统
  中图分类号:G434 文献标识码:A 文章编号:1007-9599 (2012) 12-0000-02
  目前网络远程教育的普及使得优质教学资源突破了时间和空间的局限性,使得终身学习成为可能。而当前网络教育的开展,也出现了种种弊端:技术方面,多以教学资料呈现形式的转换为主,只是书本搬家而缺少一定的交互模式;而其不同学习进度、不同兴趣、个性化的学习需要基本不能得到一定的满足,无法因材施教。因此,网络教育需要强大的技术力量帮助学生迅速高效地搜寻到满足其个性要求的教学资源,并对其学习整个进程进行正确指引与科学评价。本文试图设计一种系统模型,利用数据挖掘技术来改进当前的网络教育模式,对每一个学生都提供个性化的学习进程,达到一下学习要求:
  学习系统可依照与当前登录学生相似的学生的学习步骤自动的对其后续目标知识进行预测和推荐
  针对学生的学习过程进行过程性考核,并依据成绩动态改变学生的学习与练习进程,对此学生的掌握不好的地方进行再次督学
  本文依据以上目标,构建了基于Web的个性化学习系统模块(Web-based Personalized Learning Core System 下文简称WPLCS)来满足远程教育中学习者个性化学习的迫切需要。
  在该系统核心算法的选型上锁定了数据挖掘技术来构建WPLCS。下面图1便是基于网络的个性化学习系统核心模块(Web-based Personalized Learning Core System)数据挖掘引擎的基本架构:
  
  数据挖掘技术是从多样的、无序的数据中,抽取提炼出有用的信息的过程。因此数据挖掘技术被广泛商用。但在教育领域中应用此技术,就不能简单的套用一些商用模式,因为电子商务中的服务器端在进行数据挖掘时只需知道大量的用户在访问了A页面后又去访问了B或者C页面,证明他们对B、C页面有潜在的兴趣,从而向访问过A页面的用户的客户端动态的推荐B、C页面,以此来达到个性化引导客户访问的目的。
  而在网络教育中,若系统锁定学生感兴趣的知识和关注知识页面的时长等信息,不但可以依据此信息灵活地改变练习和考核进程,还可重构网站结构减少网络响应时长。与此同时,在设计网络课程的页面时,力图使嵌有某些特定知识页面和网络课程中的知识点形成映射关系,也就使得系统能够清楚标记出学生对于知识的掌握情况。从而在数据挖掘过程中能够做到以知识点为导向。
  WPLCS利用数据处理模块将系统的用户访问日志文件和数据库构建出一个学生基本特征数据仓库,再在此数据仓库的基础上,利用多种数据挖掘算法进行挖掘从而形成学生个性化数据挖掘库。
  数据预处理
  本阶段首要找准挖掘数据源,本文遴选出系统服务器中的日志文件和系统数据库数据作为数据源。抽取数据源数据形成挖掘库,即学生特征数据仓库。
  服务器访问日志的预处理
  学生从登录到系统服务器开始,便在此服务器上留下相应的日志文件。它包括登录学生的IP、URL、Cookie等信息。首先抽取网络日志中的信息,再清洗数据缺值等脏数据,最后识别学生的IP及登录Cookie值,合并同一个学生的访问路径请求,将时间跨度大的URL进行相应的区分和记录。
  构建数据挖掘库
  匹配系统数据库预处理后的数据和服务器访问日志预处理得到的数据,构建出数据挖掘库,即学生特征数据仓库(学习者标识、个人信息、学业信息、偏好信息等)。
  数据挖掘
  综合考虑不同数据挖掘算法有不同的特点和弊端以及前文所述的个性化学习的要求,在选择数据挖掘算法时,本文选取了序列模式、聚类、关联规则发现等不同算法,并将其有机结合。为了精确匹配当前学生特征模式与规则前项,力争较高的推荐准确率,采取了基于关联规则的挖掘方式进行学习页面推荐;为了得到更高的推荐覆盖率,采用基于聚类分析进行推荐。综合了两种数据挖掘算法的优势,从而改善了推荐的测度。本文将学生特征数据仓库中的数据传送到数据挖掘核心模块来进行数据挖掘,得到的数据再存放到学生个性化数据仓库来完成整个数据挖掘的全过程。
  关联规则发现
  关联规则发现,即寻找数据项之间的联系规则。在服务器访问日志数据的预处理过程中,将学生访问的页面路径组成了学生访问session集,我们可以利用关联规则挖掘得到学生访问请求间的关联规则。其中比较简单的一种规则为:访问了A页面的学习者中,有60%又访问过B页面。得到这种初始化关联规则后,再通过用户访问页面与知识点的一一映射关系,我们就可以推理出更加实用的规则模式,即确定在学习过A知识点的学习者中有60%的人对B知识点表现出一定兴趣。得到这种有用规则后我们即可对所有访问A页面的学习者的页面上加上B页面的推荐链接,方便学习者导航。
  聚类
  聚类,即将数据划分到不同的类中,类间的差别尽可能的大,类内的差别尽可能的小,聚类分析实现并不知晓将要划分成几个类,而是利用系统服务器自动化、智能化的计算而得。产生出不同的类后,某学生的特征模式一旦符合某个类后,系统推荐引擎会自动将此学生未来可能访问的页面链接推荐给学生。由此就可以智能化地将处在不同学习阶段的学生匹配到此类本该获得的学习和考核进程。
  序列模式
  与关联规则发现相仿,序列模式是将数据间的关联性与时间相联系。在实际挖掘过程中,我们可以得到下列序列模式:在学习过B和C两个知识点的学生中有81%的学生在若干天后进行A知识的学习,并且在此过程中大量地频繁访问A2、A5、A7、B2等知识,而且对这些知识点的掌握情况开始下滑。因此我们可以及时干预在此时间段所有学习过C、B知识点的学生,将一定量的练习和测试推荐给他们,帮其熟练掌握上述知识,从而达到因时施教的目的。
  作为一种新的教学手段——基于Web的网络教育,当前正方兴未艾。本文旨在通过计算机数据挖掘技术构建出一个智能化的基于网络的个性化学习核心系统,以此来辅助完成对不同学生的个性化教学。从而充分发挥网络教育的优势。
  参考文献:
  [1]W.H.Inmon 《Building the Data Warehouse》 John Wiley & Sons,Inc. 1996
  Penelope Markellou ,Ioanna Mousourouli《Using semantic web mining technologies for personalized E-Learning experiences》Research Academic Computer Technology Institute,2004
  [2]Robert Cooley, Bamshad Mobasher, Jaideep Srivastava 《Data Preparation for Mining World Wide Web Browsing Patterns》《Knowledge and Information Systems》1999
其他文献
科学探究作为化学课程改革的突破口,不仅是新课程的重要学习内容,而且是一种有效的学习方式.探究性综合实验题不仅对课程改革具有强大的推动作用,而且是新课程理念在考试评价中的
摘要:本文首先对数字图像处理技术进行了概述,并对数字图像处理技术的基本原理进行了分析,在此基础上介绍了数字图像处理技术的应用。  关键词:数字图像处理技术;基本原理;应用  中图分类号:TN911.73 文献标识码:A文章编号:1007-9599 (2011) 10-0000-01  The Principle and Applications  of Digital Image Processi
学习动机是指激励并维持学生朝向某一目的的学习行为的动力倾向.学习动机与学生的学习兴趣、学习需要。个人价值观、态度、志向水平、外来鼓励、学习后果(如学位、待遇及社会地
本文从计算机网络的含义和发展历程着手,分析了武警部队网络信息安全存在的主要危险,并针对这些威胁提出了几点对策。旨在与同行共同切磋探讨。
物体内部所有分子做无规则运动的动能和分子势能的总和,叫做物体的内能.一个确定的物体内能大小与物体的温度及体积有关.物体内能改变有两个途径:做功和热传递.由于内能的概念很抽
云计算是分布式计算技术的一种,通过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。本
课堂教学中的问题情境是发生问题的客观情景或某种外在刺激模式.在初中物理课堂教学中,借助问题情境,能让学生更好地从情境中提出问题,从而引导学生探究、解决问题,形成知识的构建
摘要:根据当今社会对计算机专业人才的需求和计算机专业人才的培养目标,中等职业学校,特别是农村中等职业学校更必须以岗位职业能力为依据,进行专业课程设置改革,使培养出来的专业人才能够满足社会各行业与企业的需求。本文从目前农村中等职业学校计算机专业课程设置的现状着手,对计算机专业学生的就业形式与就业岗位的职业能力进行分析,阐述了目前农村职业学校要发展好职业教育,就必须以关注学生的职业能力为依据,对计算机
人们在认招新事物和探索世界的过程中,必不可少的素质就是观察和探究能力,其决定了人们是否能顺利完成某种活动或掌握某方面知识.北学学科的基础是实验,教师应培养学生的观察与探
图象法是函数的三种表示方法之一,因而函数图象中蕴含着丰富的数学信息.通过多种途径获取信息,是我们必备的基本技能之一.你能从函数图象中最大限度地获取信息吗?我们就以二次函数