面向移动应用问题报告的自动标注方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:siyuezaici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着智能手机与平板电脑等移动设备的普及,运行在移动设备上的应用程序(app)的数量也急剧增加。目前,移动设备上的移动应用程序市场内已经拥有数百万的移动应用。如此规模的移动应用的维护对于开发人员来说是一个巨大的挑战。开发人员通常需要通过软件维护方法来保证移动应用程序的质量,从而提高用户的满意度。他们通常会提交问题报告来描述在使用应用程序的过程中出现的缺陷,功能请求和其他更改。标签(例如,缺陷,功能请求等)是表明问题报告所描述问题的严重程度的重要属性。如果问题报告的标签是‘bug’(缺陷),这意味着问题报告描述了严重错误,开发人员应该首先修复该错误。否则,如果标签不是‘bug’(例如,‘feature request’(功能请求)等),那么开发人员可以稍后解决。近几年的研究表明,在问题报告历史仓库中有超过30%的问题报告没有标签。对于这些没有标签的问题报告,开发人员们需要花费额外的时间来人工验证每个问题报告,即决定每个问题报告的标签。人工验证每个无标签的问题报告这一过程需要消耗大量的人力资源和时间资源,因此,需要开发出自动化标签推荐方法来降低开发人员的工作量。为此,本文提出了一种自动标注无标签的问题报告的新方法。本文的主要研究内容和创新如下:本文结合了词频-逆文档频率方法,余弦相似度(cosine similarity)计算方法,自然语言建模方法Word2Vec,微软概念图,应用于问题报告仓库中的重复报告的探测的方法BM25Fext,杰卡德相似系数,对用户评论进行分类的SURF方法,设计出了四种文本相似性度量方法计算每个无标签的问题报告与用户评论之间的文本相似性以及各个无标签的问题报告和历史已标注的问题报告之间的文本相似性。作为结果,如果混合相似度分数大于阈值,则将问题报告标注为‘bug’或‘feature request’。否则,问题报告将标注为其他,这意味着它不会描述软件缺陷或功能请求。最后,本文对提出的新方法进行了实验验证研究。为了评估该方法的有效性,本文搜集了17个开源移动应用的问题报告和相对应的用户评论信息。基于这些数据对该方法进行性能评估和分析。本文使用F1评估矩阵来说明方法的性能,通过与以前的研究方法进行比较,发现本文提出的方法的F1分值高于以前的研究方法,这说明本文提出的方法可以准确的对无标签问题报告进行标注,并取得较高性能。
其他文献
复合材料作为一种新兴材料,凭借其强度高、重量轻、隔热性好等优良性能,近年来被广泛应用于工业生产的各个领域。但其在加工制造及使用时,可能会产生脱粘、孔隙等缺陷问题。这些问题会使复合材料性能快速下降,最终影响材料的可靠性。尽管破坏性试验检测法可以较好地完成材料的质量检测,但其破坏了材料的结构,因而只能抽样检测,无法实现在线实时检测。因此,应用先进的无损检测技术实现对材料缺陷的检测与判定,具有重要的现实
姿态作为重要的导航参数,随着智能驾驶、无人机和无人车等技术的兴起,得到了越来越多的重视。在基于不同传感器的测姿技术中,GNSS测姿具有全天候、精度高和误差不随时间累积的优势,但在挑战环境下,测姿精度、连续性和可靠性会迅速降低。MEMS惯性(简称MEMS)测姿则具有低成本、体积小,自主无源的优点,将GNSS与MEMS两者进行信息融合可实现优势互补,获得更好的测姿结果。根据GNSS天线的数量,GNSS
数字隐写技术是保障通信安全的重要手段,但也为恶意的非法通信提供了便利。隐写分析技术作为隐写术的对抗手段,其目的是检测信号中是否嵌有秘密信息,在这个注重信息安全的时代具有重要的研究意义。数字音频是人们生活中常用的数字媒体之一。音频应用与音频处理软件的普及极大地促进了音频隐写和隐写分析技术的发展。在复杂的大数据取证场景下,音频数据通常具有多样性和复杂性,攻击者使用的载体数据模型和隐写算法通常是未知的,
特征匹配作为计算机技术和人工智能中一项基本的图像处理技术,在许多计算机视觉应用中都扮演着关键的角色,比如图像检索、图像配准、三维重建等。随着计算机技术和人工智能在人类日常生活中日益广泛的应用,人类对特征匹配技术的有效性、稳定性和泛化能力都有着更加迫切的要求。在特征匹配过程中,如何确定两个特征属于同一目标是非常困难的,特别是在匹配特征在外观上非常不相似,而非匹配特征又特别相似的情况下。因此,设计一个
随着地球人口膨胀、陆地资源短缺、生态环境恶化等情况的加剧,人类逐渐将目光聚焦于占地球表面积71%的海洋。水下图像在海洋生物研究、海底资源勘探、海洋军事应用和水下考古等领域起着关键作用,具有重要的研究价值。水下图像相比声学图像具有更加丰富的细节和色彩信息,在水下科考和工程实践中具有不可替代的地位。高质量的水下图像既满足了人们的视觉感知需求,又有助于高层视觉的应用。然而,由于水下成像环境的独特性和复杂
随着人们日常生活水平的提升与人工智能技术的迅速发展,越来越多的智能家居系统、人工智能机器人等高科技产品进入人们的生活中。手势交互作为指令下达最为简洁、便利的人机交互方式之一,一直是计算机领域的研究热点。相较于穿戴比较繁琐且设备价格高昂的穿戴式手势识别技术,基于视频信息的动态手势识别技术则更为大众所接受。近年来,深度神经网络以强大的特征提取能力以及模型泛化能力在手势识别领域取得了较好的成绩。本文深入
在有机光伏材料中,单线态分裂是一种在特定有机分子中发生的激发倍增现象,即分子吸收一个光子可以产生两个电子空穴对。作为一种多激子效应,单线态分裂可以有效地避免能量损失,提高太阳能电池的光电转换效率。近年来,随着超短激光脉冲和时间分辨技术的出现和发展,科研工作者们对单线态分裂的研究不断深入,然而其物理实质还有待进一步揭示。红荧烯作为常见的单线态分裂材料,其单晶、多晶、薄膜的单线态分裂研究层出不穷,但是
随着社会的发展和科技的进步,数字音频已经成为人们日常生活主流的信息载体。由于Cool Edit、Cakewalk以及Audition CS6等音频处理软件的广泛应用,人们肆意伪造或者篡改数字音频的行为也日渐增多。随着数字音频面临日益严重的信任危机,近年来国内外涌现出很多数字音频取证技术的研究。数字音频取证技术是通过解决数字音频的真实性、完整性以及原始性等安全问题,以达到保障数字音频安全性的目的。截
现阶段5G技术的发展日新月异,5G商用未来可期,面对当下5G三大业务场景的广大需求,中国移动创新提出SPN(Slicing Packet Network,切片分组网)网络架构应对5G全新应用场景需求,各个通信设备制造商遵循移动提出的SPN技术标准,致力于研发SPN设备,满足移动SPN设备测试规范的要求。SPN采用分层网络模型,分为切片分组层(Slicing Packet Layer,SPL)、切分
三维石墨烯虽然具有快速的充电速率、长的循环寿命、丰富的孔径结构和高的电导率等优异性质,但由于其比电容较低,较大程度的制约了其在超级电容器中的应用。将聚苯胺(PANI)与三维石墨烯复合可以提高其比电容,但由于聚苯胺与石墨烯的界面接合较弱,这会影响该类复合电极材料的电化学性能。针对这一问题,本文提出采用功能化修饰方法,用氨基(-NH2)、磺酸基(-SO3H)对三维石墨烯进行表面功能化修饰,调控聚苯胺与