基于联合神经网络模型的学生编程题目理解方法研究

来源 :内蒙古师范大学 | 被引量 : 0次 | 上传用户:wllzjw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言理解是使用机器自动理解文本内容的方法或模型的总称,它是实现自然语言与机器进行沟通的重要方法。学科题目作为自然语言文本的一个子集,其中包含了大量的抽象逻辑和知识内容,因此,对各类题目文本的理解也逐渐得到研究者们的重视。题目理解是指使用计算机技术自动理解题目内容,获取题目的关键信息,它是实现题目自动解答的必要过程,也是辅助学科教育的一项重要手段。目前,题目理解已在语文作文、数学几何题目、物理题目等学科教育领域中得到广泛应用。不仅在学科教育领域,计算机编程教育领域也亟需一种能够自动理解学生编程题目的方法和技术。学生编程题目往往通过生活实例来抽象程序算法,包含大量的教学知识,准确提取出求解编程问题所需的关键信息将有助于启发学习者并为其提供解题的思路。然而,由于编程题目本身的抽象性、复杂性等特点,导致传统的自然语言理解技术无法有效理解学生编程题目。本文通过总结现有自然语言理解的方法,分析学生编程题目的特殊性,结合自然语言理解过程,进一步思考如何准确理解学生编程题目。论文的主要内容如下:1.利用神经网络优势,构建联合模型理解学生编程题目。对编程题目的理解旨在获取题目中的关键信息,即求解编程问题所需的知识点与算法。学生编程题目具有描述较抽象、专业术语较多、结构性较强等特点,因此,本文从编程题目的语义含义和题目中单词的词性出发,利用深度学习优势提出一种基于联合神经网络模型的学生编程题目理解方法。首先,使用双向长短期记忆网络(Bi LSTM)对编程题目文本进行词性标注;其次,使用不依赖于人工特征的卷积神经网络(CNN)提取学生编程题目的语义特征信息;最后,将编程题目的词性标签和语义特征拼接后,采用条件随机场(CRF)进行解码,获得编程题目的关键信息,完成编程题目理解任务。2.在联合神经网络模型中引入注意力机制,提高模型理解编程题目的准确性。使用联合神经网络模型对编程题目进行理解时,繁杂的理解过程导致联合模型规模较大、结构较复杂、训练耗时较长等问题。本文在编程题目理解过程中的词性标注和特征提取两部分引入注意力机制,使得模型可以选择与当前信息更相关的部分,提高模型理解效率。此外,由庞大的联合模型引起的梯度爆炸问题也得到解决,提高了模型处理数据的能力,进一步提高模型对编程题目理解的准确性。3.搭建编程题目检索实验系统,为学生学习编程提供帮助。使用联合神经网络模型对学生编程题目进行理解后,本文进一步搭建编程题目检索实验系统,将这一研究应用于计算机编程智能教育中。学习者可以对编程题目进行检索,获取求解问题的关键信息。该系统为学习者求解编程问题提供指导性帮助,提高学习者的编程实践能力。4.分析编程题目理解结果,并对编程题目检索实验系统进行评估。为了验证联合神经网络模型对编程题目理解结果的有效性,本文设置了对比实验与之进行比较,实验结果证明本文方法能够更好地理解编程题目,并在精确率、召回率和F1值上分别取得92.92%、85.59%和88.64%的得分。此外,为了验证对学生编程题目理解的实用性,本文通过问卷调查的方式对编程题目检索系统进行评估,评估结果表明有大部分学生认为理解较准确,且对学生学习编程有帮助。综上所述,本文首先分析了学生编程题目文本的特点,建立适应性模型理解学生编程题目;然后,融合不同神经网络建立联合模型,并引入注意力机制对学生编程题目进行理解;最后,为了验证题目理解的实用性,搭建编程题目检索实验系统,并通过实验证明使用本文方法理解编程题目的有效性且研究结果具有一定的实用价值。
其他文献
手写汉字评价是根据手写汉字与标准汉字特征之间的相关性,实现汉字的评估以及提出如何提高书写水平建议,其在中小学阶段发挥着重要作用,能有效辅导学生理解手写汉字的缺陷进而提高手写汉字的书写质量。而数据到文本生成任务恰好可以利用不同手写汉字特征之间的相关性作为输入,得到手写汉字评价。本文通过总结数据到文本生成方法的现状,分析生成文本与模板的关系,结合基于深度学习的文本生成相关技术,进一步思考如何将深度学习
学位
蒙古文词切分是蒙古文信息处理的基础,也是蒙汉机器翻译等下游任务的关键。近年来,深度神经网络模型在自然语言处理领域得到广泛应用,在分词研究任务中也取得了不错的成绩。本文首先利用多种深度学习模型对蒙古文词切分方法进行研究,通过对比蒙古文部分切分、BPE切分和神经网络切分方法对于蒙汉机器翻译性能的影响,并提出了一种改进的神经网络蒙古文词切分基础上过滤停用词的蒙汉神经机器翻译方法。主要研究内容有:首先,将
学位
随着教育领域的智能化,教育系统及线上学习平台中试题资源呈指数增长,如何避免数据资源的浪费,合理有效利用海量教育数据获取个性化试题资源、为知识水平各异的学生分配合适的题目并实现个性化学习已成为亟需解决的研究课题。试题难度作为衡量试卷合理性、考试公平性的准则,在传统的试题难度标注中主要依靠专家标记,具有主观性强且劳动密集的局限性。本研究通过摘要抽取方法抽取题目关联课程资源的文本信息,丰富试题的上下文语
学位
目的:评价富血小板血浆(platelet-rich plasma, PRP)疗法联合腰交感神经节射频热凝术治疗糖尿病足溃疡的临床疗效。方法:选择2021年1月7日至2022年3月31日于上海市浦东医院疼痛科接受治疗的40例糖尿病足溃疡病人,按随机数字表法分为两组,各20例,射频组(R组)采用腰交感神经节射频热凝术,联合组(P组)在射频组基础上联合PRP治疗。记录两组病人治疗前和治疗后1、2、4、6
期刊
算法识别旨在通过一种自动化的方式实现等价算法语义的识别,它是一种评估算法行为和程序功能的有效手段,也是软件工程领域中一项重要的子课题。算法识别在程序理解、重复代码检查、剽窃检测以及程序诊断和验证等方面具有广泛应用。不仅在工业软件的开发和维护领域,计算机编程教育领域同样亟需探索算法识别理论及相关技术。一个编程问题会有许多个相似或独特的程序代码,差异性显著的程序是算法逻辑不同的体现,识别出这些程序有助
学位
词向量是自然语言处理任务的基础。跨语言词向量借助迁移学习将单语词向量映射到一个共享的低维空间,在不同语言间进行语法、语义和结构特征的迁移,可以对跨语言语义信息进行建模,是解决低资源语言信息处理和语言鸿沟引起的跨语言信息处理的重要基础环节。然而目前跨语言词向量的学习性能较大程度上依赖于大规模的平行语料或高质量的种子词典等,对于平行语料较少的蒙汉跨语言词向量的学习效果不太明显。蒙古语为低资源语言,很难
学位
识解是人们选择用不同方式对同一个情境进行概念化的认知能力。在翻译过程中,译者会对一个语言表达式有不同的理解和有意识地翻译,这种有意识的做法带有译者的创造性翻译。认知语言学中的识解理论则为人们主观思维的分析提供了可行的方案。本文以潘家洵翻译《玩偶之家》为研究案例,主要从识解理论中的辖域和背景、视角、突显、详略度这四个维度,对比该译本的初译本和复译本,以期探讨认知在翻译过程中对译者的影响。
期刊
<正>企业年金在整个运营管理过程中,涵盖了计划建立、成员变动、日常缴费、投资成交和待遇领取等重要环节,运营层面任何环节出现问题都可能会对企业年金资金的安全性和独立性构成风险。由于企业年金运作模式的特点,涉及的外部管理机构较多,易造成的风险因素不尽相同,所以需要以受托管理机构(以下简称“受托人”)或年金理事会,根据合同和协议的约定对企业年金进行监督和管理,同时,受托人可选择和更换其他外部管理机构。通
期刊
图像分割技术是计算机视觉中最为基础也是最为重要的部分,随着人工智能场景的应用普及,图像分割技术的要求也越来越高。其分割技术的质量,很大程度上会影响后续图像处理结果。目前,关于图像分割技术的研究已经有着数十年的历史,从早期的图形学处理算法,到如今的基于学习的神经网络算法。随着硬件、计算能力的迅猛发展,基于目标检测,语义分割,实例分割为代表的计算机视觉技术,再次进入到人们的视野当中。以深度学习为基础的
学位
问答系统是人工智能领域备受关注的研究方向,也是自然语言处理的重要分支。随着互联网数据的暴涨、硬件设备性能提升以及深度学习技术的成熟,越来越多的智能产品已经融入到人们的生活。目前,主流的自动问答系统都以中文、英语等语言为主。而由于蒙古语文字本身的复杂性、研究人员少以及缺乏公开可用的问答语料库等原因,蒙古文问答系统的研究仍处于起步阶段。本文对蒙古文自动问答进行了如下研究:1.构建了蒙古文问答语料库通过
学位