面向程序编译错误的自动反馈生成技术研究

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:zhaofaqiang0124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
编译错误是新手程序员在编程过程中不可避免遇到的一类错误,其中编译器报错信息通常是协助解决编译错误的主要参考内容。然而,新手程序员因经验不足而难以理解报错信息,进而无法顺利定位并修复错误。研究表明,无法及时解决编译错误会显著降低新手程序员的学习热情。程序错误自动修复技术可以在一定程度上修复编译错误,但仅仅修复错误并不能帮助新手程序员理解错误产生的原因并提升编程能力。基于程序员解决编译错误的过程,改进编译器报错信息可以帮助程序员理解和定位错误。有研究提出在编译器报错信息中增加编译错误分类信息,但所提出的编译错误分类方法主要基于程序静态分析和程序修复模式设计,无法覆盖所有错误,同时由于编译错误分类预测模型的分类效果不够准确,反而影响新手程序员准确定位错误。改进编译器报错信息是帮助定位和修复编译错误最直接有效的方法。本文以在编译器报错信息中提供准确错误分类信息为目标,首先研究一种细粒度的编译错误分类方法,基于程序的最小可分析单元token,提出一种基于token类型的编译错误分类方法。其次,课题引入Text CNN神经网络构建错误分类模型,结合对编译器报错信息的分析,准确定位目标token,同时根据目标token反馈相应的语法规则,协助程序员修复错误。最后,本文整合所有研究结果改进编译器报错信息,设计并开发了基于token的编译错误信息自动反馈系统。为了评估基于token类型的编译错误分类方法,本文选取了Deepfix数据集和TEGCER数据集中的16926个学生程序进行实验研究。结果表明,基于token类型的编译错误分类方法比最新的TEGCER分类方法多覆盖16.5%的编译错误,并且本文设计的分类模型具有更好的预测性能。在验证错误反馈信息有效性的实验中,本文进一步从BUCTOJ平台收集了12648个C语言编译错误。实验结果显示,在编译错误分类准确的基础上,80%以上的程序能够正确定位目标token并返回有效的语法规则。
其他文献
平面对称群是欧几里得平面等距线的不连续子群,在平面内两个线性独立的等距平移下表现不变性。因其在晶体学、化学、物理、图案设计等方面的应用价值,平面对称群受到广泛的关注。人们可以凭借与生俱来的感知对称的能力,对17种平面对称群图案进行分类。然而,在过去的几十年里,平面对称群图案的自动分类仍然是一个艰巨的挑战。本文的目的是为了找到一种自动而有效的方法从图片中识别这17种平面对称群结构。本文所做工作如下:
学位
随着互联网和移动设备的发展,线上社交媒体用户数激增,使得在线社交网络(Online Social Network,OSN)已经具有相当复杂的自身特性和行为模式,吸引了很多研究学者对社交网络的特性、模式及规律等进行分析研究。但由于在线社交网络具有庞大的规模,同时涉及到隐私访问限制等问题,使得获取完整的大规模在线社交网络数据具有一定困难。因此,很多研究都是基于社交网络的样本网络进行实验。样本网络的质量
学位
目的 分析社区老年人肌肉减少症(肌少症)的患病率及影响因素。方法 检索PubMed、Embase、The Cochrane Library、Web Of Science、CINAHL、维普数据库、中国知网、万方数据库、中国生物医学文献服务系统等数据库从建库至2021年7月关于社区老年人肌少症患病率及影响因素的相关文献,采用RevMan 5.3软件对社区老年人肌少症患病率及影响因素进行meta分析。
期刊
旅行商问题是一种在组合优化领域广泛研究的NP-hard问题,目前研究学者已经开发了许多不同的群体智能和近似算法来解决该问题。但到目前为止,关于旅行商问题多解优化的相关研究较少,因此本课题主要针对蚁群优化算法进行相应的改进以更好地解决多解旅行商问题。在群体智能算法方面,本文主要总结群体智能算法的结构与特性。在多解旅行商问题方面,本文主要整合相关测试集及评价指标用于算法的有效性验证,并提出一种基于蚁群
学位
城市是典型的动态复杂系统,个体间以及个体与外部环境间存在的较强的非线性相互作用和由此产生的涌现行为是复杂城市系统的重要特征。城市的正常运作有赖于大量个体的高效交互,因而揭示居民间时空交互接触模式所蕴含的普适规律对于包括流行病传播、城市规划及交通工程等各类城市研究至关重要。然而过去由于数据采集的限制,学者们难以获取高时空精度的个体轨迹与交互数据。近年来随着信息通信技术的发展,手机已然成为某种意义上的
学位
一直以来,社团划分和聚类分析被认为是相似的,其目的都是将相似的对象分为一组,但近几十年来都被分开研究,缺少一个统一的框架去处理这两类问题,其中一个重要原因在于向量数据和拓扑数据之间的差异。异质性是网络拓扑中社团结构和向量数据中簇结构存在的共同条件,它表示数据的重要属性间存在差异,相比之下,均质性的晶格网络或随机均匀分布的数据点则不存在团簇结构。以异质性为基础,本文将向量数据中密度的概念扩展至拓扑数
学位
随着技术的进步,工业过程向着智能化发展。由于设备一般工作在正常状态,只是在很短的时间内处于故障状态,导致采集的各类故障数据呈现出不平衡的特点,给故障诊断带来了困难。同时,采集到的数据还具有不平衡、非线性、强耦合和具有流形结构等特点。如何对不平衡故障样本进行数据生成并提取有效特征,成为提高诊断精度的重要因素。流形学习算法相比与传统故障诊断方法,能保留数据的局部结构信息,提取与故障相关的主要特征。局部
学位
工业的发展是建设社会主义现代化强国的关键,近些年我国工业生产规模不断地扩大,生产设备也愈加精密化,同时得益于更加便捷的数据采集存储技术,大量的生产过程历史数据被记录下来,这为基于数据驱动的故障诊断技术创造了良好的发展条件。工业生产过程的数据一般具有高维、动态的特点,因此从测量空间提取数据的有效特征、考虑数据的时序相关性是十分重要的。基于上述问题,本文进行了以下研究:(1)提出一种基于马氏距离的局部
学位
【目的】探讨发芽-挤压膨化-高温α-淀粉酶协同处理对速食糙米粉的冲调性、流动性、色度、风味和淀粉消化性能等品质特性的影响,为高品质速食糙米食品的加工提供理论依据。【方法】糙米经发芽处理后采用高温α-淀粉酶辅助挤压膨化协同处理(Extrusion-Germinated Brown Rice-Enzyme,EGBRE),以糙米发芽直接挤压膨化处理(Extrusion-Germinated Brown
期刊
2021年是我国著名会计学家、审计学家裘宗舜教授诞辰100周年。裘宗舜先生一生致力于会计理论与方法研究,著作等身,影响广泛。裘宗舜先生潜心立德树人,率先垂范,培养了大批优秀人才。为了更好地纪念缅怀裘宗舜教授对我国会计事业作出的突出贡献,江西财经大学会计学院举办了系列纪念活动,并将办公大楼命名为"宗舜楼"。裘老弟子们发起设立了宗舜教育基金,同时邀请著名会计学家郭道扬、曲晓辉、秦荣生、魏明海、李心合和
期刊