基于半监督学习的在线学习社区短文本分类研究与应用

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:a553892340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,慕课网MOOC、OpenStax Tutor、腾讯微课等在线学习平台成为越来越多的学生在非课堂环境下获取知识的重要来源,这些在线学习平台不仅能够提供多种功能帮助学习者突破时间与空间的局限,随时随地的获取各种知识,还存在着大量学习者发布的短文本数据,依据这些短文本数据中所蕴含的潜在语义信息进行目标分类,可以用于学习分析领域中的多种应用场景,如对学生进行情感原因分析、对学生进行学习资源推荐等。因此,对在线学习平台中存在的短文本进行目标分类任务是一项具有实际意义的工作。然而,目前存在的大多数在线学习社区短文本分类模型采用的是有监督学习方法,其模型预测的准确性依赖于标签数据集的规模大小,如何使用少量数据标签集,准确高效地完成在线学习社区短文本分类任务是本文的研究重点。为此,本文基于半监督学习方法,提出了一种在线学习社区短文本分类模型,并设计了一个在线学习社区短文本分类系统。具体地,本文所做的主要研究工作如下:第一、构建在线学习社区短文本分类模型。本文提出了一种基于半监督学习的在线学习社区短文本分类模型Joint-GanBert。首先,在数据预处理部分采用数据增强技术扩展模型训练集;其次,使用大规模预训练模型BERT获得在线学习社区短文本数据的语义表示;然后,基于半监督学习生成对抗网络SS-GANs完成在线学习社区短文本分类任务,并在SS-GANs中加入了融合结构,进一步提高了模型的分类效果。本文模型在真实在线学习社区短文本数据集上进行了实验,并与BERT模型做了实验对比,实验结果表明,本文模型能够在降低数据标记成本的前提下,有效地完成在线学习社区短文本分类任务。第二,设计了一个在线学习社区短文本分类系统。本文将所提出的分类模型Joint-GanBert应用于在线学习社区实际场景中,设计了在线学习社区短文本分类系统,该系统可以完成短文本情感分类和问题误解检测任务,并依据分类结果对课程进行情感可视化分析和问题可视化分析,具有一定的实际意义。
其他文献
伴随移动互联网技术的快速发展,大数据、云计算、全球定位技术等得到了广泛应用,由此产生了海量的时空轨迹数据,基于位置的互联网服务如雨后春笋般涌现出来。大量移动终端用户对基于位置服务的各式需求,交通工具的增加带来交通拥堵、资源调配等交通负荷问题层出不穷。近年来受新冠疫情的影响,时空伴随者的及时管控对早期疫情防控而言具有重要意义,通过感染者时空轨迹数据的聚类研究,快速有效识别潜在感染者的时空高密度聚集点
学位
黑盒全局优化问题被广泛地应用于工业制造、农业、人工智能等诸多领域.针对这一问题,国内外学者提出了多种优化搜索算法,其中基于代理模型和序贯设计的贝叶斯优化方法近年来受到广泛关注,成为了研究热门领域.期望提升(EI)函数是贝叶斯优化中被广泛使用的采集函数,文献中称基于EI准则和高斯过程(GP)替代模型的贝叶斯优化方法为高效全局优化(EGO)算法.EGO算法综合了高斯过程模型中的预测期望和方差,并在正态
学位
关于荀子人性论的研究,近代以来争论颇多,有性恶说、性朴说、性向善说、性有善有恶说、性善说等等,可以说学界尚未达成普遍的共识,对荀子人性论的认识,各家的理论、方法有较大的差异,也表明了荀子人性论思想的复杂性。因此,对荀子人性论再研究是必要的,以什么理论和方法来研究显得尤为重要。论文梳理了荀子人性论思想的基本范畴和思想逻辑,在阐明其人性论基本范畴的内涵、各范畴的逻辑关系的基础上,讨论荀子人性论的主要思
学位
中华传统廉洁文化是中华优秀传统文化的重要组成部分,其在中华民族五千多年的历史长河中形成了丰富的内涵。中华传统廉洁文化能为新时代高校党风廉政建设提供廉洁文化理论滋养、廉政制度导向、实践指向。以中华传统廉洁文化滋养新时代高校党风廉政建设,应遵循高校党风廉政建设发展的规律,通过强化思想、完善制度建设、创新载体等方式,开创高校党风廉政建设发展新局面。
期刊
阿尔都塞在西方马克思主义谱系中占据着重要地位。本文聚焦于阿尔都塞的唯物主义思想,它在早期体现为反主体主义的唯物主义。此时,阿尔都塞运用了结构主义的方式,在“科学”与“意识形态”这对范畴中深入地解读了马克思主义,进而得出他早期的唯物主义理解,即作为“科学”的马克思主义的唯物主义以及“理论上的反人道主义”。它在晚期体现为“偶然相遇的唯物主义”,以“偶然”的内在逻辑为线索,对唯物主义的哲学内涵以及谱系进
学位
自我国在2013年对数学课程进行改革后,高中数学这门课程的内容以及教学方式在不断的发展和完善。相比于原先全国统一的标准及教材,这一轮改革之后数学教材会更具多样性,即采用统一大纲、教材多本的模式来逐步对数学教育进行适当的改革。我国对教材进行的相关研究获取的成果较多,特别是对各类教材进行的对比,例如我国和国外的教材对比、我国原先和当前的教材对比、我国不同版本的教材对比等等。此次研究是分析人教A版和北师
学位
关于阳明之“知”,学界已有不少研究,且分梳出了“知”的诸多含义,如本体之知、认识之知、工夫致知等。然则,这些研究大多是基于“概念-命题”的研究范式,在理解时往往会存在贯通不明的问题,即学者们虽然基于不同角度对“知”进行诠释,但未看到其后所蕴藏的“彻上彻下”一贯之结构。为更好地诠释彰显此“知”,本文采用“意象诠释”这一方法,而此诠释方法实即是“以易观道”,以易之展开“意-象-言”这一结构为核心,通过
学位
总体性方法是罗莎·卢森堡研究时代现象的基本方式,对事物的总体性把握是其理论和研究方法的重要特征。面对时代提出的马克思学说和社会现实的融合问题,她运用总体性方法,对马克思的历史辩证法作了方法论的阐释。她洞察社会现实的方式体现了对马克思总体性方法的实际运用。正如卢卡奇所言,她的表述方式“意味着向原来的、未被歪曲的马克思主义的复归:向马克思本人的表述方式的复归”(1)。在对帝国主义资本主义政治经济现象的
学位
21世纪以来,数字摄制技术和互联网技术深化发展与融合,助推纪录片步入了新的发展阶段。在此背景下,纪录片实践中诞生了一种全新的创作模式——协同创作式纪录片,一度作为纪录片研究重点的“真实性”命题也在这种新型纪录片创作模式中衍生出新的内涵和外延。通过研究真实性在协同创作式纪录片中呈现的新意涵和新挑战,不仅能够探析数字时代下协同创作式纪录片这种崭新的纪录片形态给纪录片领域带来的活力和新面貌,还能够丰富纪
学位
篆刻是将书法(主要是篆书)和镌刻(包括凿、铸)相结合,用于制作印章的艺术。篆刻艺术讲究篆法、章法和刀法三者有机结合,正是由于篆刻所特有的艺术表现形式,才使得篆刻艺术于方寸之间就可展现篆刻者的艺术素养和审美情趣,因而具有源源不竭的顽强生命力,一直深受古代文人雅士的推崇和喜爱。篆刻艺术作为一门中华优秀传统技艺,蕴藏着深厚的历史底蕴和博大精深的文化内涵,具有极高的艺术鉴赏价值与文化传承意义,可以作为优质
学位