【摘 要】
:
随着大数据时代的到来,人们可以通过网络获得不断更新的学习资源,通过整合并结构化存储这些学习资源,可以实现对学习资源的链接,并且便于对学习资源的加工重用。这一过程与联通主义所支持的“学习即在节点间建立链接”、“知识不断更新”的思想相呼应。为实现这一过程,需要对自适应的Web信息抽取技术进行研究,将半结构化或非结构化的网页内容抽取出结构化的信息。本文将汇聚了名校精品课程的MOOC平台作为研究对象。在M
论文部分内容阅读
随着大数据时代的到来,人们可以通过网络获得不断更新的学习资源,通过整合并结构化存储这些学习资源,可以实现对学习资源的链接,并且便于对学习资源的加工重用。这一过程与联通主义所支持的“学习即在节点间建立链接”、“知识不断更新”的思想相呼应。为实现这一过程,需要对自适应的Web信息抽取技术进行研究,将半结构化或非结构化的网页内容抽取出结构化的信息。本文将汇聚了名校精品课程的MOOC平台作为研究对象。在MOOC平台中,知识以课程为单位存储在网页中。本文通过借鉴主流的信息抽取技术,结合联通主义的知识观与学习观,进行了自适应Web信息抽取研究。研究经历了从课程属性到课程关系的抽取过程。首先,本文提出了基于模板与特征相结合的课程属性抽取方法。该方法通过计算文本节点信息熵的方式,挖掘出网站中的公共部分、标识出可选部分,从而生成抽取模板,之后采样目标抽取信息,结合与文本内容无关的四类局部文本特征,最终生成针对课程不同属性的特征向量,通过特征向量对模板抽取结果进行筛选;其次,本文提出跨网页的课程关系抽取方法。在研究中预设了课程的三种关系,针对不同关系选用不同的课程属性作为比对数据源,并为不同文本类型(描述类文本、实体类文本)的属性信息设计不同的比对方式。在此基础上,按照关系优先级,依次抽取课程间关系,并将抽取结果存储在Neo4j数据库中。最后,本篇研究通过对国内三大MOOC平台中的300门课程属性的抽取,以准确率与召回率为标准,验证属性抽取方法的可行性;使用关系抽取方法实现了对30门课程的部分关系抽取。此外,本文实现了高等教育计算机课程知识图谱的构建,该知识图谱将有助于提高学习者在线寻找知识和构建个人知识网络的能力,并为现有的课程推荐、课程检索、课程规划、课程设计等领域研究提供帮助。
其他文献
在2018年5月份中共中央办公厅发布了《关于进一步激励广大干部新时代新担当新作为的意见》,要求全国各地的部门深入贯彻落实。《意见》指出在新时期广大干部必须要有新担当、
针对三相黑油模型模拟时大规模对角稀疏线性方程组存储占用大量内存、求解耗时的问题,研究大规模稀疏系数矩阵的压缩存储及求解方法。提出了有效节点压缩和块压缩存储结合的
胃癌是最常见的恶性肿瘤之一,发病率和死亡率居消化道肿瘤的首位。胃癌病理分型系统众多,传统分型以形态结构和细胞组织学特性为基础,不同组织类型的胃癌,其形态结构和生物学行为
目前会计专业本科阶段计量经济学课程教学中普遍存在着学生数学基础薄弱,教学课时少,缺乏会计专业案例以及师资不足等问题,结合我国计量经济学和实证研究的发展以及会计专业
中职英语教学大纲提出要培养学生的英语写作能力,形成职场英语应用能力,而目前中职学生英语写作能力未达到大纲的要求,主要原因是教学方法失当。教师常常采用布置写作任务,学
影视作品是著作权领域一项重要的作品形式,改编权是著作权人一项重要的著作财产权利。随着我国影视产业的迅速发展,当前由文学作品改编成影视作品的侵权案件不断出现在司法实
自2007年以来,村镇银行以拥有机制灵活、依托现有银行金融机构等优势,取得了飞速的发展,对我国农村金融市场供给不足、竞争不充分的局面起到了很大的改善作用。但村镇银行在
为了探索兰炭在工业锅炉中的应用方式,降低工业锅炉的运行成本,本文采用ZTC-B型综合(同步)热分析仪对固体炭质产物兰炭与浒苔掺混燃烧过程进行了热重分析和动力学分析。结果
我国中学提倡学生“用英语做事情”,英语应用文写作是英语课程的重要组成部分。然而不少学者与教师认为,以语法为导向的写作教学模式在英语应用文写作教学效果欠佳。此外,高中英语新课标强调思维品质的培养与课程内容的语境化,也对英语应用文写作教学的改革提出了要求。随着理论与实践的发展,新的写作教学法陆续出现,其中,Badger&White提出的过程体裁法,在近年来受到广泛的关注。过程体裁法的跨学科理论
目的:间充质干细胞(mesenchymal stem cells,MSCs)具有优秀的自我更新、多向分化及免疫调节性能。外泌体是一类由真核细胞分泌的细胞外微囊泡,介导细胞之间的信息交流。MSCs