面向移动应用的众包测试报告排序技术研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:cassyqc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件测试是软件工程不可或缺的重要环节之一,而众包测试是软件测试的一个重要分支。在众包测试中,工人执行测试任务并提交测试报告,开发者需要对提交的测试报告进行审查和评估。由于测试报告数量众多且往往质量参差不齐,开发者在人工审查过程中将花费大量时间,直接影响了众包测试效率。近年来,出现了许多自动化技术,如聚类、分类和排序技术,以减少审查数量并提高审查效率。然而面对移动应用众测报告的文本和图像信息时,已有的报告分析技术未深入探索文本和图像之间的关系。针对以上情况,本文从报告自身的特征出发,研究如何最大化利用文本和图像信息,提出了三种改进的移动众包测试报告排序技术。(1)针对移动应用测试报告中文本描述简短、信息不足的问题,提出了一种基于数据增强的测试报告排序技术。该技术先对报告中的文本信息分词,并采用OCR技术提取报告中截图的关键词。接着汇总以上关键词,对于关键词较少的报告,借助相似报告为它生成新的关键词。最后根据报告的关键词集合,采用贪心策略算法来抽样,从而提高审查报告的效率。(2)针对现有技术仅对文本信息分词,未深入分析理解文本内容的问题,提出了一种基于文本和图像理解的测试报告排序技术。该技术将文本描述进行分类,分为描述系统行为和描述重现步骤两种情况,对这两种情况采用不同的文本特征提取方式。接着将文本特征和降维后的图像特征拼接,通过对聚类后的报告类簇进行抽样,来生成审查顺序。(3)针对现有技术仅关注审查不同类型缺陷的效率,并未考虑到缺陷严重性的问题,提出了一种考虑严重性的众包测试报告排序技术。该技术从测试报告的文本和截图信息中提取特征,利用哈希技术对测试报告建立索引,接着对哈希表中数据进行抽样,选择每个索引对应数据中文本信息熵最大的报告,来获得报告集的审查顺序。其中,在面向移动应用众测报告的文本和图像信息中,图像传达出更客观的信息,因此我们更多地利用图像特征。本文针对移动应用场景下,众包测试报告文本描述简短、截图丰富的特征,提出了三种排序技术,能够减少人工审查的报告数量、有效提高报告审查效率。
其他文献
事件抽取是自然语言处理领域的一项基本任务,其目的是抽取文本中事件的触发词及其论元,抽取的事件信息能给知识图谱、对话和问答等下游任务提供有力的帮助。近年来,随着深度学习技术迅猛发展,替代传统静态词嵌入的预训练技术随之兴起。借助预训练模型,研究事件抽取开始有新的方向,利用问答去进行事件抽取就是一个新思路。在新方法应用到事件抽取任务上取得成效的同时,一些问题也亟待解决。譬如,句子级事件抽取模型先验知识有
学位
推荐系统是互联网快速发展的产物,它可以帮助用户在信息过载的情况下从项目池中寻找满足偏好的项目。由于传统的推荐系统是利用交互历史来估计用户意图,因此这种静态方法存在无法捕获兴趣漂移、只能被动获取用户偏好等缺陷,这些限制不可避免地影响了推荐系统的性能,而通过在推荐系统中引入对话可缓解上述问题。本文致力于研究对话推荐方法,即主动与用户进行对话来动态捕获用户偏好,最终实现在有限轮次内向用户推荐合适的项目,
学位
立场检测旨在给定的目标话题下,自动判断用户意见文本的立场态度(如支持、反对等),这对了解民众意愿、政府决策和智能推荐等具有重要意义。目前,深度神经网络模型由于其出色的性能得到广泛的应用,但文本外的大量信息仍未得到很好的挖掘与运用,特别是社交媒体中的用户信息交互等方面。本文的研究内容主要包括以下三个方面:(1)研究基于上下文关联关系的立场检测针对上下文信息交流单一而导致的交互信息易被忽视问题,本文基
学位
<正>数字金融是金融行业与互联网技术融合后产生的新金融服务形式,代表着金融行业未来发展的新方向、新趋势。在新技术赋能下,数字金融的服务功能比传统金融业更智能、更便捷、更高效,对区域经济发展也产生了更为深远的影响。本文聚焦数字金融这一新生事物,深入探究其对经济社会发展的影响机制,提出促进区域经济高质量发展的对策和建议。
期刊
问题生成(Question Generation,简称QG)是智能问答领域的重要任务之一,旨在根据给定文本,自动生成语法通顺、语义相关的自然问句。该技术能够赋予机器“自主提问”的能力,在新兴的智能教育、自动问诊和社区问答等场景中应用价值广泛。现有的问题生成研究往往采用教师强制学习方式,其驱动模型生成与标准问句相仿甚至一致的自然问句。然而,QG模型在测试阶段并无可参考的标准问句,仅能依靠非置信的信息
学位
随着城市地下空间不断发展,大断面矩形隧道因其较高的空间利用率逐渐得到广泛运用。通常情况下,暗挖矩形断面隧道多运用顶管法施工。施工中预制管节和地层相互作用主要体现为界面摩擦,且摩擦效应随着管节不断顶进而持续积累。因此,摩擦效应在顶进中不断累积会对周边地层造成持续性的扰动。由于矩形顶管的管土接触面积大,“背土效应”下摩擦作用对地层扰动影响显著高于常规圆形顶管。目前,针对矩形顶管施工地层变形分析中较少考
学位
现阶段,14天行程轨迹的查验已成常态化疫情防控的常用手段,基于轨迹大数据的实时处理有效作用于疫情防控中的时空伴随者监测、疑似病例的密切接触者排查等场景。同时,随着智慧城市建设进入新阶段,轨迹大数据计算与城市治理融合的模式及形态正在发生重大变化,表现在离线场景的轨迹分析已不能满足现状。日新月异的应用要求充分挖掘轨迹大数据的“新鲜”价值,亟需突破大规模轨迹数据的实时管理与精准查询手段,这对提升城市治理
学位
随着互联网信息资源的爆炸式增长,“信息过载”问题在搜索、电子商务、视频网站等众多网络应用中日益突出。作为解决“信息过载”问题的有效方法,推荐系统已经成为大数据时代的热门话题,在学术界和工业界得到了广泛的应用。目前,大多数的推荐系统都是基于用户的个人信息和历史行为数据进行推荐。然而,在许多场景下,推荐系统模型都是基于原始特征交互来获取信息,导致用户的个人信息和历史行为并没有得到充分的利用。仅仅在原始
学位
近年来,联邦学习作为一种新的人工智能边缘计算范式引起了广泛关注。联邦学习利用多个边缘设备作为参与者来协同训练深度学习中的全局模型,并且训练的过程不会泄露任何参与方的本地数据。在典型的边缘计算场景中,联邦学习的参与者通常为异构分布,由个人电脑、智能手机、物联网设备、网络设备等各式设备组成。在设备异构的背景下,算力较弱的设备被称为掉队者,会成为联邦学习中每一个训练轮次中的瓶颈,进而限制模型总体收敛速度
学位
基于全监督学习的目标检测在现实场景下严重依赖完整标注的数据,使得在一些现实检测场景中难以应用传统的全监督学习方法,本课题采用弱监督学习方法开展目标检测方法研究。在弱监督目标检测中由于缺乏位置标注信息,模型易使目标尤其是非刚性目标的检测结果收敛到目标最具判别性局部区域,从而导致目标的检测结果不完整。此外在进行伪标记过程中过分关注分类置信度最高的局部目标区域,使得其他正实例样本挖掘不充分。因此本文针对
学位