论文部分内容阅读
随着互联网技术、多媒体技术的发展以及虚拟现实技术的元年到来,人类对于教育的方式和方法有了颠覆性的认识,如何利用好网络上现有的教学资源,使网络更好的服务社会已经成为一项极其重要的任务。目前,大部分海外高校都会在网络上发布数字化课程资源,这些资源囊括所有学科并且十分丰富,然而,各大高校都有一套独立的数字化课程资源体系,这对用户在检索和浏览的过程中造成了不便。 本研究从计算机领域的数字化课程资源出发,建立了一个以个人主页为切入口,以文本分类以及相关标签操作为手段的数字化资源采集体系,连同文献资源平台向用户提供更加全面的教学资源检索体验。这对探索建立囊括多领域的数字化课程资源系统是具有重要的探索意义。以学校主页到个人主页到课程主页到课程资源这条链接为线索,通过朴素贝叶斯分类算法对大量网页文本数据进行初步分类,然后在Topic Basd Similarity的基础上,根据个人主页文本上下文依赖性强的特点,考虑主题-文本模型,提出了新的相似度计算法,相比于TBS方法,提高了2.6%左右的分类准确率。在目标课程页面的基础上,通过构建对于目标课程主页以及子页面的资源分布网,抓取目标课程的课程大纲表格以及课程资源,汇聚了目标数字化课程资源,建立了统一的检索、浏览、笔记的系统。