Web数据挖掘技术在网络教育论坛中的应用研究

来源 :新疆师范大学 | 被引量 : 0次 | 上传用户:sanhaijin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,网络教育论坛逐渐成为一种教育资源平台并得到充实壮大,成为人们尤其是教师和学生日常交流、研究、学习中不可或缺的要素。网络教育论坛尤其是与专业方向密切相关的论坛上有大量交流思想、探讨学习和专业研究的帖子,这些帖子本身就是极好的教育资源,论坛对某个话题的深入广泛的讨论会使其成为热点话题而受到广泛关注。因帖子的数量庞大,手工统计分析网页上帖子已不能满足应用要求。Web数据挖掘技术的发展,使深入研究和分析教育论坛的帖子内容成为可能,为研究者提供了强大的技术支撑。利用Web数据挖掘技术研究教育论坛中有关专业研究学习方面的热点话题,并把研究结果反馈于教育教学活动,是对变革教育方式积极有益的探索,对加快教育现代化进程具有重要意义。文章主要利用Web数据挖掘技术对网络教育论坛上的内容展开研究。以北大中文论坛的中文信息处理版块为研究对象,挖掘论坛中的热点话题和话题领袖,从而对课堂教育教学提供补充和扩展,加快教育方式变革。文章主要完成了以下工作:(1)获取网页文本数据是Web数据挖掘的第一步,本研究实现了利用网络爬虫程序下载网页,使用DOM树和正则表达式解析网页以获得所需要的正文内容。在进行大规模网页采集、抽取时,对采集到的数据进行清理、筛选、转换,并将结果存入本地数据库中。(2)实现并改进正向最大匹配中文分词算法,使分词的粒度较大,便于划分出一些学科的专有名词。研究设计的中文分词词典能很好地支持本算法的实现。(3)编程实现了经典的K-means聚类挖掘算法。通过对论坛网页的聚类分析发现网络教育论坛中讨论的热点话题,通过判断和分析热点话题,就可把握话题的发展方向,了解教育论坛中人们研究、学习的主要方面,以此辅助教学。(4)根据挖掘结果,有针对性地关注热点话题、关注话题领袖引领的话题可以解决在专业方面反映突出的问题,进而可以利用好课堂内外两个平台。课堂教学是教育教学工作的重要部分,而通过网络教育论坛解决学生学习中遇到的问题是对教育方式变革积极有益的探索。
其他文献
用5组标准菌株与38个稻瘟病菌菌株进行交配,结果表明不同标准菌株测得同一组稻瘟病菌菌株的育性和交配型差异很大;进一步研究表明这是由于标准菌株之间存在有性态形成能的差异
下文立足于我国建筑产业造价控制实际情况,以某机场建设项目为例,对该机场建设项目中制定的造价控制制度、造价控制方法等进行了详尽论述,指出机场建设项目造价控制必须要有
通过对不同产地的同一玉米品种产量的比较,证明亲本纯度是导致产量差异的主要原因,即亲本纯度越高,杂种优势越强,并提出相应的解决对策.
高校机电一体化专业单片机教学过程中,扩展8255和LED数码管动态显示两部分内容学生普遍反映难以掌握。对此给出单片机扩展8255控制LED数码管动态显示仿真教学案例,通过程序单
英语属于语言学科,其目的在于交流。小学阶段的英语教学就是要培养学生的兴趣,提高学生的口语表达能力。而教育课程的改革,英语口语交际能力的提升也是英语素质教育中重要的
上市公司独立董事是指不在公司担任除董事外的其它职务,并与其所受聘的上市公司及其主要股东不存在可能妨碍其进行独立客观判断的关系的董事.