面向软件演化的日志质量增强技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:koptity
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件规模的不断扩大,软件故障诊断的难度也随之提升。软件日志记录软件运行时信息,在软件故障诊断中占据重要地位。但开源软件的日志质量参差不齐。一方面,日志开发缺少完善的规范,开发者往往依据个人经验和主观认识来进行日志决策。另一方面,日志代码会随软件演化中的故障诊断或功能更新而演化。现有工作往往从单一版本的软件中挖掘日志开发经验,忽略了软件演化中蕴含的日志管理知识,无法有效解决第二类问题。为此,本课题计划从软件演化的角度出发,指导日志修改。受代码克隆启发,课题调研了开源软件的日志演化特征,发现上下文相似的日志其修改行为也相似。基于该结论,本课题实现了一款自动化工具:LogTracker。LogTracker挖掘日志上下文和修改行为之间的关联关系,并基于学习的规则,自动检测日志缺陷,推荐合适的语法修改。综上,全文的主要工作如下:1.调研Httpd、Git、Postfix、Collectd等开源软件的日志演化特征。调研结果表明开源软件中平均有54.1%的日志修改包含相似的修改行为,其中67.0%是由上下文相似导致的。另外,课题发现平均80.3%上下文相似的日志修改包含相似的修改行为。上述结论表明上下文相似的日志往往经历相似的日志修改行为。2.基于调研结论,本课题设计了自动化工具LogTracker。该工具自动挖掘日志上下文与日志修改行为之间的关联关系,即日志修改规则。在八款调研软件中,LogTracker成功挖掘到1432条规则,这些规则涉及的日志修改类型多样。为准确描述日志上下文语义,课题提出的LCDM算法,改进了现有的代码上下文描述算法,利用关联函数表达日志上下文语义。实验结果表明LCDM算法的准确性较现有算法提升了12.4%。3.基于挖掘的日志修改规则,LogTracker可以自动定位代码内的日志缺陷,并为其推荐语法修改。实验结果表明,LogTracker定位日志缺陷的平均准确率为98.7%,且所推荐语法修改的准确率达到了86.5%。此外,LogTracker在调研的八款软件的最新版本中,检测到295条日志缺陷。目前,已经向开发者提交了43条,其中31条被接受。
其他文献
光电探测器(PDs)作为应用在军事、科研工作以及国民生活中不可或缺的器件有着重要的作用。作为衡量PD的条件,要求其响应度要高、响应和恢复时间要短、探测范围广和成本低等特点
建筑能耗占全球总能源消耗总量的30%以上,而空调系统的能耗占据建筑能耗之首,空调系统的节能优化控制是节能减排以及国民经济可持续发展的重要手段。当前公共建筑空调优化运
随着人们对通信安全越来越重视,信息隐藏技术也开始受到研究者的关注。信息隐藏技术是将隐秘信息嵌入到正常通信载体中且不被攻击者发觉的一种隐秘通信技术。而信息隐藏检测
根据摩尔定律的描述,随着集成电路技术的不断发展,晶体管的尺寸在不停的减小,集成度变高,性能提升。但在器件的尺寸等比例缩小的同时,各种不良效应也越发明显。如今的微电机
为探究亚洲热带植物地理分布格局与形成机制,现以亚洲热带特有属风筝果属为例。首先按照风筝果属物种分布范围和特有性将风筝果属物种分为三类:广布种、区域特有种和狭域特有
乒乓球是一项速度快、旋转强、落点要求高的运动,“力量、速度、旋转、落点和弧线”五大要素构成了乒乓球运动的基础。乒乓球在我国乒乓球运动之所以能够长盛不衰,是与我国对
近年来,面临经济发展和供给侧结构性改革的要求,并购重组成为我国企业整合资本技术资源、快速增强企业竞争力的重要方式。自2015年以来并购重组出现了爆发式增长,随着并购数
在供给侧结构性改革背景下,交叉持股作为企业治理手段其重要性日益凸显,目前学者已针对其动机和效应展开了丰富的研究。但是还缺乏从网络的视角来讨论交叉持股对股价崩盘风险
近年来,增强现实、机器人导航和同时定位与地图构建等技术引起了学术界和工业界的广泛关注,其中基于影像的定姿定位技术是一项关键任务。相机姿态估计是根据从3D场景中获取的
20世纪90年代以来,随着商会史研究的深入发展,同业公会研究逐渐受到学界重视,并呈现出研究的繁荣景象。作为其中重要的同业公会组织,银行公会研究所取得的丰硕成果令人侧目。