数据挖掘在流媒体课外学习支持系统中的应用初探

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:ooqqa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:随着计算机技术和网络的飞速发展,基于流媒体的学习支持系统成为学习者重要的学习方式,此类系统拥有一定规模的访问数据,本文充分利用数据挖掘技术发现学习者的特征和流媒体被访问情况,提出了如何构建基于流媒体课外学习的数据挖掘系统,以及该系统的应用。
  关键词:数据挖掘;流媒体
  中图分类号:TP311.13
  课外学习支持系统可以帮助学习者深入理解已学得的知识,解决模糊的问题,拓展知识面,培养学习的自主性。以流媒体的形式传输学习内容很大程度上解决了网络带宽的问题。课外学习支持系统主要研究如何利用计算机化的电子工具帮助人们解决日常工作中碰到的问题,达到提高工作效率和效果的目的。它给学习者提供了自主学习的机会,学习者可以根据个人课堂学习的情况形成课内课外多渠道的立体学习方式。课外学习系统可以根据自身的需求,“定制”自己需要的信息,系统也会根据用户的需求、兴趣爱好、能力差异等特点,智能化的为用户选择对应的学习资源,提供智能化的学习指导。但是,此类系统大多存在一个问题,即在拥有一定访问量的情况下,系统并没有记录下使用者(学习者)的学习情况、学习效果及有关信息,以供教师分析研究。这造成了一种资源的浪费,因为无论是学习者主动留下的或是系统自动记录下的信息都可能是影响学习者学习效果和效率的一种因素。
  本系统构想以学习者主动填写表格以及系统自动记录两种形式将信息录入后台数据库,经过对数据的处理、分析和挖掘,发现数据中隐藏的信息。数据挖掘技术在系统中的应用,帮助教师找到隐藏的提高学习者学习效果的因素和方法,通过访问数据发现学生的习惯,兴趣,认知风格等,同时根据学生访问规律调整网站结构,动态的订制个性化的网站。
  1 系统组成
  系统主要由视频点播和数据处理两大块组成。视频点播部分又由服务器、网络传输和用户终端构成。其中媒体服务器使用高性能的PC服务器,其主要功能是完成流信息的发布;媒体工具机需要安装声卡、视频采集卡、VCD或录像机、Windows 7或Windows NT,并安装media编辑工具,其主要功能是完成流信息的采集、编辑、生成等功能,并将生成的ASF文件存放到存储服务器上;存储服务器安装Windows 2000 Server,并具有大容量存储设备。数据处理部分由用户终端和数据库、数据仓库部分构成。用户终端以网页的形式使用视频点播服务,系统将记录下学习者的各种信息,并录入数据库,提供给数据挖掘原始数据。
  2 数据挖掘的应用
  下面我们主要探讨系统中数据挖掘技术的应用。
  数据挖掘又称为数据库中的知识发现,它通过对大量的历史存储数据进行分析和分类得出有意义的模式和关系的过程。数据挖掘的应用十分广泛,挖掘对象可以是关系的、事务的、面向对象的和对象-关系的数据仓库。按照挖掘的数据类型的不同,可以分为空间数据挖掘、时间序列数据挖掘、文本或多媒体数据挖掘以及网络数据挖掘。特别是网络数据挖掘,可以从用户使用网络的过程中发现用户的偏好,对发现学习者在学习过程中潜在的影响因素非常有效。
  2.1 界面模块
  界面模块是学习者使用系统并与系统进行交互的界面。通过它,学习者可以学习系统提供的知识内容,手动添加学习者信息。
  2.2 信息收集模块
  本系统试图收集收集使用者的两部份信息:使用系统的原因,学习特征。数据收集方式以学习者填写表格和系统自动收集为主。通过第一类方式,可以收集到学习者的姓名、性别、年龄、教育程度,使用系统的各种情况等等。通过第二种方式,系统可以自动记录学习者使用系统的时间,经常点播的内容等记录与学习相关的内容。
  2.3 数据抽取模块
  数据库中的数据需要在收集起来以后不能马上作为数据挖掘的对象,需要经过一定的例程转换、过滤并建立模型。这里我们将信息收集阶段的数据转换,建立星型模型,其中建立两个关联。
  第一个关联是事实表的关联,事实表包含4个字段:用户ID、使用时间、最频繁使用资料、系统时间。其中事实表中的“最频繁使用资料”关联最频繁使用资料表,该表包含背景资料、导学资料、原理再现分析、学习进度计划、学习方法指导、参考文献或相关链接。事实表中的“使用时间”关联时间维度表,该表包含系统时间、年、月、日、时刻。
  第二个关联是用户维度的关联,用户维度表包含6个字段:用户ID、姓名、性别、喜欢的学习环境、喜好的学习材料、思考习惯。其中“喜欢的学习环境”关联喜欢的学习环境表,该表包含独立空间、集体学习。“喜好的学习材料”关联喜好的学习材料表,该表包含文字材料、图文并茂材料、多媒体材料。“思考习惯”关联思考习惯表,该表包含:独立思考、共同讨论。
  3 数据分析模块
  在将数据进行转换、去噪,并利用模型建立可以进行数据挖掘的数据仓库后,我们使用关联规则分析数据。考虑到每个人对节目访问的时间长短和频度,我们对关联矩阵的行或列向量进行规一化处理。对关联矩阵的列向量进行规一化处理得到矩阵,矩阵列向量反映了该学习者对网站的各个网页的访问偏好情况,实际上表现了访问者类型。关联矩阵的每个行向量反映了所有访问者对某一个网页的访问情况,实际上蕴涵有访问者共同的访问模式。
  课外学习系统可以通过机器学习来观察用户的行为,利用挖掘技术掌握之前的访问行为,从而预测今后的访问趋势,还能提供一个比较智能的服务体系及时了解学生的状况、需求、能力差异、学习进度、兴趣爱好等,以上的系统设计只是简单的提供简单的设计思路,如果想要进一步进行关联分析,聚类分析,统计分析应采用更加复杂和完善的一个系统工程。
  4 结束语
  在网络学习的环境中,重视学习者在学习过程中隐含的因素,挖掘并分析这些因素是目前网络环境学习研究中可以深入探索的一个方向。基于流媒体的课外学习支持系统不但提供了学习者自我学习的机会,同时也应该在后台对所有学习者进行分析归类。本文仅对数据挖掘在该系统中的应用进行了构想。其实,系统分析归类的结果应该作为学习者再次登陆后动态显示网页的依据,真正做到个性化的学习环境和学习服务,并提供因人而异的学习诊断和评价。总之数据挖掘技术将越来越成熟,我们相信数据挖掘将成为如何教学形式中不可或缺的最有效工具之一,在数据挖掘的技术支持下,教育系统工程的教学评估将上升到一个新的高度。
  参考资料:
  [1]Richard J.Roiger,Michael W.Geatz.翁敬农,译.数据挖掘教称[M].北京:清华大学出版社,2003.
  [2]邓晖.论网络环境下的学生特征分析系统设计[J].开放教育研究,2003(01).
  [3]严华云.Web挖掘在网络教育中的应用研究[J].湖州师范学院学报,2003(06).
  作者简介:周磊,男,江苏无锡人,讲师,上海交通大学工程硕士,研究方向:数据挖掘、自然语言处理。
  作者单位:无锡高等师范学校,江苏无锡 214153
其他文献
论文从植被的种丰富度和功能多样性两个方面研究不同沙漠化阶段科尔沁沙地植物种多样性与沙地草场地上生物量的关系.相关分析表明,在科尔沁沙地不同沙漠化阶段,植物种多样性
牛属反刍动物,胃组织构造较为特殊,胃部一直以来都承受着较大的负荷压力,因此,在牛胃处也极易发生各类疾病。文章主要是对常见牛胃病的诊断及治疗相关问题进行了分析研究,希
目的:探讨影响精神分裂症患者社会功能的因素。方法:采用单因素分析的方法对97例精神分裂症患者的近期社会功能进行预测,以期早期对精神分裂症患者进行干预,起到预防和延缓衰退的
马克思的自由观是科学的唯物主义自由观,它是在批判吸收欧洲近代哲学的基础上,结合无产阶级的革命实践发展起来的,具有鲜明的唯物主义特点,是自由观发展史上的历史性变革。
【摘 要】小学语文是一门综合性很强的课程,教学内容的丰富性决定了教师的教学方式多样性和课堂训练方式的多变化。在教学的过程中培养学生的自主创新能力,是需要教师和学生共同努力才能达成的目标,培养学生独立发现问题、解决问题、新的思考方式和事物都是一种创新。教师在培养学生的创新能力使要善于从多个方面入手,从多个方面来培养学生的创新能力,这样才能帮助学生尽快的成长,培养学生的创新能力。  【关键词】小学语文
摘要:随着国家医疗改革的深入推进,医院信息系统的建设应用对于提升医疗服务水平起着关键作用,同时为医院信息化建设带来了崭新契机。在医院各种信息系统集成化管理的过程中,用户身份的合法性和访问权限的验证是目前亟待解决的关键问题。由此,本文提出了一套基于互联网的医院单点登录与授权管理系统构建方案,能够有效保护医院信息系统的数据资源,防止了患者信息泄露、病例信息篡改等安全事件的发生。  关键词:互联网;单点
在信息技术和计算机技术高速发展的当今社会,如何提高高职院校计算机专业的教学水平,使学生能满足社会发展对计算机专业技术人员的要求,是高职院校计算机教育工作者应该深入思考
本文对数字化校园建设过程中所出现的重技术轻指导、缺乏相关技术工作、缺少资源互通等问题的进行了分析和研究,并提出了相应的完善策略。
【摘 要】随着新课改的迅猛发展,教育教学更加关注学生的综合素质。六大核心素养的提出,无疑给教育教学带来了全新的曙光。初中数学教师要以培养学生的六大核心素养为重要内容,不仅要注重知识技能的教授,还应关注学生情感、道德品格的发展,以促进学生综合素养的发展。本文立足初中数学教学实际,就初中数学教学中如何培养学生的核心素养提出几点浅薄的意见。  【关键词】初中数学;核心素养;策略和方法  【中图分类号】G