FP-Tree算法在自适应学习系统学习者特征模型建立中的应用研究

来源 :东北师范大学 | 被引量 : 2次 | 上传用户:lixiaojin1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自适应学习系统中,由于学习者的学习特征众多,数据库系统是一个庞大的数据资源,每天都会有大量的记录存储到数据库中,其中可能会包含一些重复的、无关紧要的、甚至是相互矛盾的记录。另外当前教育学专家对影响学生学习的特征的说法不一,造成教育学领域对学习者特征的评判没有统一的标准。因此,需要对大量的学习者的学习日志进行统计分析,找出对学习者影响最大、最具诊断意义的学习特征。本文以自适应学习系统为背景,利用人工数据合成工具生成实验数据,研究出一个适合于自适应学习系统的关联挖掘算法,并将此挖掘算法应用于自适应系统中,逐步纠正自适应学习系统中学习者特征模型,使学习者更好地利用系统进行学习。根据自适应学习系统学习者特征的特点,本文对FP-Tree算法进行了改进。首先从算法自身进行改进,针对频繁项集过多的问题,提出在FP-growth的基础上进行改进的关键项抽取算法KEFP-growth,忽略了在分析时不关心的频繁项集。接着从数据源方面进行了改进,针对数据源过大导致挖掘效率低下甚至无法在内存中加载FP-Tree的问题,本文提出数据投影算法,就是采用分而治之的思想,对数据库频繁1-项集分割成各个频繁1-项集的数据库子集,然后分别对数据库子集进行挖掘,再将其合并。最后将KEFP-growth算法和投影算法相结合,这样既可以消除无意义的频繁项的挖掘,又可以在大数据量时候又能对数据进行划分。本文还通过实验比较了三种改进算法以及原FP-Tree算法的性能,实验表明采用KEFP-growth算法和数据库投影算法相结合的算法最适合于自适应学习系统的学习者特征的挖掘。本文基于改进的FP-Tree的算法成功地完成了自适应学习学习者特征建立挖掘的相关性研究,也为自适应学习系统的知识发现提供了进一步的研究思路。
其他文献
无线频谱是无线网络中最珍贵的资源之一,随着无线网络的发展,未授权频谱资源越来越拥挤,而授权频谱的利用率却相对较低,为提高授权频谱的利用率,提出了认知无线电网络(CRN)。
互联网的域间路由系统使用边界网关协议BGP在不同自治系统之间传递路由可达性信息。作为BGP协议的一部分,内部网关协议iBGP用于在单个自治系统内部的路由器之间传播自治系统之
作为一类主要的组合优化问题,车辆路径问题(VRP)一直受到了计算机科学和运筹学界的广泛关注,在实际工业生产调度中发挥了重要的作用。然而随着交通线路的日趋复杂化以及客户
目前,获取图像的方法越来越丰富,得到图像的数量也在不断增多,近几年数字图像处理方面的研究工作受到了大量学者的关注,一些图像处理的基础研究工作也随之变得重要起来。在很
随着全球信息数字化进程的日益加快,二值图像因其存储简单、结构紧凑的优势得到广泛应用,许多重要资料以二值图像格式保存,所以研究二值图像中的信息隐藏对于信息安全和产权
传统的并行计算任务往往由大型的并行计算机来完成,因而并行机的研究也就成为并行计算的主要研究方向。随着经济和科技的发展,生物医学、天气预报、高能物理等领域的计算任务
随着网络技术和因特网的迅速发展,网络已经成为人们进行交流和相互联系的有效平台,它存储了大量的信息、数据。由于信息量的庞大,对于网络用户来说,如何能够及时地发现和利用有用
保护主机防止潜在的恶意移动代码(malicious mobile code)是移动代码安全的重要问题之一,当前国内外的很多研究机构针对此问题已经做了大量研究。其中,携带模型代码(Model Ca
作为知识发现中的核心环节,数据挖掘能够从海量数据中提取有价值的信息,是当前人工智能和信息科学研究领域中的热点课题。基于粗糙集的数据挖掘,就是利用粗糙集理论及方法从
基于局部特征与视觉辞典的视觉局部表达与索引模型是当前主流的计算机视觉系统的基本组成部分,在目标识别、场景匹配、多媒体内容搜索与分析中具有广阔的应用前景,也是目前计