论文部分内容阅读
随着互联网技术的发展,疫情的影响和停课不停学政策的推行,在线教育快速发展的同时也遇到了许多困难。其中最主要的问题是如何更好地融合线下线上课程内容和如何加强学生自主学习能力。在线下线上融合时,学生遇到了在线学习缺少交互,在线视频过长不容易抓住重点等问题,迫切需要一种将课程与教科书联系起来的对课程内容进行分析总结的工具。培养自主学习能力的关键在于准确反馈学生学习状况,而目前使用的指标例如学习时长,签到次数等易于伪造,迫切需要一种能够自动反馈学生学习状况的方法。针对以上问题,本文使用在线教育平台的即时笔记,从主题分类和自动纲要两个方面进行分析,并在基准模型的基础上提出了优化模型,设计对比实验证明了方法的可行性。
本文研究的研究对象是自动控制原理教学中所产生的即时笔记。首先针对没有该领域的主题数据集的问题,提出了用教科书来构建数据集的方法,并对即时笔记原始数据进行可视化,了解了即时笔记的基本特征。为了能够融合视频内容与书籍资源,使用主题分类的基准模型进行了实验。针对错分案例相应提出改进方案,针对特征长时依赖问题使用自注意力卷积模型,针对文档表达问题使用子词优化,针对难分类样本使用焦点损失两步训练进行优化。实验表明优化后的模型能够在各级主题上有5.56%-10.08%的提升。最后使用改进的分类模型对即时笔记进行分析。
接着本文提出了即时笔记的自动纲要任务,并将自动纲要任务分为要点发现和要点摘要两个步骤。要点发现提出了不重不漏的评估指标,而要点摘要使用的评估方法与文本摘要相同。提出了要点发现和要点摘要的基准模型,针对基准模型的实验结果,讨论了利用笔记特性构造最佳要点数的可行性,构造了利用笔记特性的批次聚类方案,讨论了利用书籍数据集作为背景语料的方案,讨论了利用优质用户的特点优化的方案,构造了优化后模型。实验表明优化后的模型性能有明显提升,能够有效解决自动纲要问题。
最后设计并实现了纲要系统,利用构建的标注语料,将全文中的两个模型在系统中进行了部署,经过测试系统能够有效工作。
本文研究的研究对象是自动控制原理教学中所产生的即时笔记。首先针对没有该领域的主题数据集的问题,提出了用教科书来构建数据集的方法,并对即时笔记原始数据进行可视化,了解了即时笔记的基本特征。为了能够融合视频内容与书籍资源,使用主题分类的基准模型进行了实验。针对错分案例相应提出改进方案,针对特征长时依赖问题使用自注意力卷积模型,针对文档表达问题使用子词优化,针对难分类样本使用焦点损失两步训练进行优化。实验表明优化后的模型能够在各级主题上有5.56%-10.08%的提升。最后使用改进的分类模型对即时笔记进行分析。
接着本文提出了即时笔记的自动纲要任务,并将自动纲要任务分为要点发现和要点摘要两个步骤。要点发现提出了不重不漏的评估指标,而要点摘要使用的评估方法与文本摘要相同。提出了要点发现和要点摘要的基准模型,针对基准模型的实验结果,讨论了利用笔记特性构造最佳要点数的可行性,构造了利用笔记特性的批次聚类方案,讨论了利用书籍数据集作为背景语料的方案,讨论了利用优质用户的特点优化的方案,构造了优化后模型。实验表明优化后的模型性能有明显提升,能够有效解决自动纲要问题。
最后设计并实现了纲要系统,利用构建的标注语料,将全文中的两个模型在系统中进行了部署,经过测试系统能够有效工作。