论文部分内容阅读
随着互联网的迅速发展,“互联网+教育”的教学模式取得了长足的进步和发展。MOOC作为其典型代表,得到了知名学府及教育机构的认同和赞赏。许多知名学府及教育机构纷纷在该领域进行了深入的研究和探索。国内清华大学推出的学堂在线、北京大学推出的华文慕课和上海交通大学推出的好大学在线等。国外麻省理工学院和哈佛大学发布的Edx以及斯坦福大学创办的Coursera等。随着MOOC平台数量日益增多以及同一MOOC平台下课程资源剧增,造成MOOC平台上的课程资源异构、繁杂和冗余等问题,从而使得用户陷入信息过载、知识迷航等困境。因此,如何统一管理众多MOOC平台上的课程资源和实现跨平台的快速检索,以及如何为用户提供有效的课程推荐服务成为当下MOOC平台亟待解决的问题。本文首先使用Jsoup爬取各个知名MOOC平台上的课程资源及其相关信息,将得到的源数据进行相关预处理,如进行缺失值填充、翻译以及教师头像性别识别等处理,处理后存储至MySQL数据库。根据本体和关系型数据库之间的映射规则将关系型数据库的表数据自动映射成MOOC领域本体,从而完成MOOC领域本体的自动构建,实现MOOC平台课程资源的语义化表达。将构建好的MOOC领域本体采用Jena解析成三元组的形式,将获得的三元组文件上传至HDFS并加载至HBase数据库。MOOC领域本体的自动构建以及采用HBase存储不仅可有效解决MOOC平台存在的课程资源异构、繁杂和冗余等问题,而且有利于MOOC领域本体的扩展。然后,通过分析MOOC平台,提取出MOOC平台课程特征,基于课程特征构建出一个语义检索模型。针对现有分布式课程推荐算法存在的推荐准确度较低的不足,设计出一个改进的分布式课程推荐算法。改进的分布式课程推荐算法是在现有分布式课程推荐算法中加入了课程特征,根据这些课程特征构建一个相似度计算模型,计算原有算法得到的课程的相似度,按照相似度高低为用户推荐课程资源列表。在课程检索时运用该模型来计算课程对象的语义相似度,按照相似度从高到低推送给用户。实验结果表明,构建的语义检索模型可在一定程度上提高课程检索的准确度。经过对比分析,改进的分布式课程推荐算法在一定程度下上可有效提高课程推荐的准确度。最后,设计和开发出一个MOOC统一平台。基于上述的理论和相关技术,采用J2EE架构开发出一个MOOC统一平台,并在该平台下实现语义检索和课程推荐服务。