一种基于BERT模型的代码评审意见质量评价体系及其支持系统的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:charmLover
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码评审对于提升代码质量、提高员工编码水平、培育企业文化氛围具有重要意义。当前业界通常以经验总结、最佳实践指导代码评审。然而在实际开发过程中,代码评审质量难以被有效度量,往往未能达到企业预期。因此,如何科学、准确地量化评价代码评审质量并形成反馈,与最佳实践结合以提高代码评审质量是软件工程实践亟需解决的问题。代码评审涉及多个步骤,因此,代码评审质量也需要从多个维度进行度量。部分代码评审质量评价指标,如代码修改率、代码合并率可以基于启发式规则度量。然而,代码评审意见质量,即评审者针对提交代码所撰写文本的质量难以基于启发式规则进行评价。代码评审意见是评审者和开发者的直接沟通媒介,是代码评审的重要组成部分。无法科学、准确地评价代码评审意见质量就难以系统地评价代码评审质量实践的效果和质量。因此,评价和提升代码评审意见质量是提升代码评审实践的基本前提。针对代码评审意见质量评价任务,本文首先提出了代码评审意见质量评价体系;随后针对该体系中相关方法,设计、实施了预处理对比、半监督对比等实验;最后基于以上内容设计并实现了一个代码评审意见质量评价系统,用于交互式地进行模型训练及数据推理。在本文提出的代码评审意见质量评价体系中,主要使用BERT模型进行特征抽取及分类,首先,本文组建专家团队使用头脑风暴法制定了一套评价标准,该标准从评审类型、情感情绪、知识传授三个方面评价代码评审意见质量;随后基于该标准制作并发布了一个用于代码评审意见评价的数据集;为提高模型的预测F1-Score,本文设计了多种评审意见预处理方法,并配合其使用了领域预训练方法;其次,针对代码评审意见标签稀疏问题,本文还对虚拟对抗训练(VAT)算法进行了增强,使其可以在使用词嵌入层的自然语言模型上使用;随后,本文还针对新数据导致的模型退化问题进行了研究,提出了定期预训练和定期标注数据的解决方案。实验结果表明,本文提出的预处理方法、领域预训练方法及半监督方法均能在不同目标任务上将模型的F1-Score提升2%至9%不等;本文针对模型退化问题提出的解决方法平均能够将模型的F1-Score提升约6%。最后,本文设计并实现的代码评审意见质量评价系统达到了支持开发者在不了解算法细节情况下进行模型训练及数据推理的效果。综上,本文提出的代码评审意见质量评价体系及其支持系统能够帮助企业有效地解决代码评审意见质量评价的问题,为代码评审实践的质量评价提供重要支撑,提高代码评审的过程效率和质量。
其他文献
随着互联网技术的迅猛发展,线上电子商务的规模迅速扩张,作为一家以电商为主要业务的创新型互联网企业,公司的业务不断扩大,需求与日俱增。为了促进消费、增强企业竞争力,公司会推出各式各样的营销活动来吸引用户,多样的线上营销形式会产生包含繁琐工作的前端页面开发的需求,比如营销活动的表单配置页面、活动效果展示页面等。这些页面都有这样的特点:在功能和逻辑上大同小异、需求比较高频、研发的性价比很低、开发的过程繁
学位
"工欲善其事,必先利其器",要想优化课堂教学、提高教学效率就要认真研究备课。尤其是面对新课改,没有现成的经验可言,大家都是在实践中探究,在探究中总结经验,这就更要发挥组内同仁的作用,正可谓:仁者见仁,智者见智。集体备课有利于发挥教师群体的智慧,弥补每位教师备课中的不足,取长补短,资源共享,共同提高。
会议
【目的】牙周骨缺损修复是牙周组织再生研究中的热点及难点,本课题旨在探讨炎症微环境下BACH1对人牙周膜细胞成骨能力的影响,为修复炎症环境下的牙周骨缺损提供理论依据。【方法】采用组织块联合酶消化法分离培养人牙周膜细胞(hPDLCs),CCK8法检测细胞增殖活性,成骨诱导hPDLCs 21天后茜素红染色实验评估细胞的成骨能力。利用大肠杆菌脂多糖刺激巨噬细胞,收集条件培养基刺激hPDLCs以模拟炎症微环
学位
当前,组合投资及组合绩效分析在理论和实践中快速发展,智能高效的组合投资管理及分析系统对于投资者研究组合投资策略、灵活调整组合资产配置、积累投资经验、规避投资风险和提高投资收益具有重要意义及研发价值。华泰证券是我国领先的科技驱动型综合证券集团,本文以华泰证券组合投资相关业务需求为开发背景,介绍了华泰证券模拟组合投资及绩效分析系统的设计与实现。本系统解决了用户对于投资组合管理、模拟组合投资实操、策略研
学位
【目的】本研究借助深度学习的手段,探究在头颅侧位片下自动识别骨性错(牙合)畸形的准确性,并探索利用软组织侧面照实现骨性错(牙合)畸形特征面容区分的可行性,为骨性错(牙合)畸形诊断、筛查和特征总结做尝试。【方法】1.收集南京市口腔医院2017年1月至2018年6月间接受正畸治疗的初诊头颅侧位片样本共2109例,侧面照样本共2040例。根据Steiner的经典研究,骨性Ⅰ类错(牙合)畸形满足[0°≤A
学位
推荐系统作为互联网公司的增长引擎,对互联网公司来说,能够极大限度地吸引用户,留住用户,增加用户粘性,提高用户转化率,从而为公司达到商业目标连续增长的目的。各大互联网公司都在大力发展自己的推荐系统。效果好的推荐系统则需要效果好的推荐模型,随着近年来深度学习的崛起,深度学习对推荐系统在推荐模型的发展具有革命性的贡献,与传统机器学习推荐模型相比,深度学习模型一方面具有更强的特征组合挖掘能力,另一方面具有
学位
【目的】运用CBCT分析成人患者拔除上颌第三磨牙后上颌结节的骨量变化,为临床提供参考。【方法】本回顾性研究选择2017年1月~2020年12月于南京大学医学院附属口腔医院正畸科就诊,拔除阻生的单侧或双侧上颌第三磨牙的成人患者共69例(男18例,女51例),年龄20~40岁,平均年龄(23.71±4.52)岁,矫治周期平均(23.07±7.79)个月,共112颗阻生的上颌第三磨牙。根据上颌第三磨牙阻
学位
背景:肝脏外科手术尤其是肝移植是早中期肝癌的最佳治疗手段,在肝脏外科手术中,缺血再灌注损伤(ischemia reperfusion injury,IRI)是不可避免的肝脏损伤过程,而且肝脏IRI跟肝移植术后移植肝的功能障碍和肝衰竭密切相关。前期研究结果发现肝脏IRI促进肝移植术后肿瘤复发,目前临床对肝脏IRI的预防和治疗手段有限,而且疗效有待进一步提高。在肝脏IRI中伴随着免疫炎症反应,表现为局
学位
南极冰芯是最重要的气候档案之一,在气候变化研究中占有重要地位。冰芯中保存的稳定水同位素记录可以作为重建过去温度变化的代用指标,对于解释古气候和环境条件是非常重要的。但是降水同位素组成与温度的斜率关系,不仅受当地冷凝温度的影响,还受到水汽源区蒸发条件、水汽来源变化、水汽传输路径及其分馏历史、云中形成降雪的微物理过程和降水间歇性的影响。此外,在南极沿海区域气旋活动频繁,降水同位素组成还受南极下降风和季
学位
报纸