软件工程数据挖掘研究进展

来源 :科学与财富 | 被引量 : 0次 | 上传用户:xdool
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:就软件工程项目当中数据挖掘技术应用的实际情况来看,信息规则挖掘技术已经逐渐被应用到了很多行业领域当中,成功地完成了对庞大数据的分析和整理,并且将提取到有用信息展现在人们面前,基于此,本文将针对软件工程当中的数据挖掘技术的研究进展展开分析,研究数据挖掘技术之所以被得到广泛应用的原因以及开发过程当中所面临的挑战,旨在能够进一步加深对该项技术的理解。
  关键词:软件工程;数据挖掘;研究进展
  0 前言
  软件工程的数据挖掘技术是数据库知识发现的重要组成部分,具有复杂性、挖掘结果的特殊及多元化等,能在一定程度上可以促进信息产业的进一步发展。软件开发阶段的数据挖掘主要是编写程序。虽然我国数据挖掘技术有了较大的发展,但是此技术还未得到广泛的应用,主要原因是应用软件可以有效提供需要分析的数据。由于大量的数据挖掘法得到了较大的发展,软件的开发水平也有了很大的提高,因此,对于软件工程数据挖掘技术的应用还需要大家对其加强一定的重视。本文具体介绍了软件工程数据挖掘的掘应用现状及发展趋势。
  1 数据挖掘的基本概述
  软件工程数据主要是指开发软件过程中所涉及的各类数据,如需求分析、可行性分析、设计等文档,开发商通信、软件注释、代码、版本、测试用例和结果、使用说明、用户反馈等信息数据,一般情况下其是软件开发者获取软件数据的唯一来源;而数据挖掘是指在海量数据中集中发现有用知识或信息的过程。
  软件工程数据挖掘的工作原理 主要包括数据预处理阶段、挖掘阶段以及评估阶段三个方面。在挖掘阶段主要是运用分类、统计、关联、聚类、异常检测等一系列算法的过程。在评估阶段数据挖掘的意义主要在于其结果应易被用户理解,其结果评估主要有两个环节分别是模式过滤和模式表示。
  数据挖掘在计算机软件工程中的研究相当多,它是分析数据的一种新颖方式。目前,随着社会工作的复杂度,需要更加完善的软件,因此对于软件代码的数量也在急剧增加进而导致了数据量的快速增长。而传统的数据计算方式已经不能满足目前对于大量数据进行分析的要求,所以,研究者希望能够发掘出一种新的数据分析方式更高效的整理出有用的数据信息。软件开发中会积累大量的数据,比如说文本数据,测试数据,用户信息数据以及用户体验反馈数据等等,软件开发者为了开发出更好的软件就必须分析和整理这些数据。但是,目前软件工程开发的软件越来越大,其数据越累越复杂对于数据的处理已经超出了人工处理的能力的范畴,所以说继续使用传统数据处理的方式来收集,整理和分析数据已经不可能实现。因此,推动了人们对于新的数据处理方式的研究,所以才提出了软件工程数据挖掘技术。
  2 软件工程数据挖掘与传统数据挖掘的区别
  2.1 数据的复杂性
  与传统的数据挖掘技术相比,由软件工程数据挖掘技术进行系统分析而得到的数据更具复杂性。软件工程数据除了包含软件版本以及软件报告等方面的信息外,还包含了系统中的代码与注释等非结构化的数据,虽然这两种数据不能以统一的方法进行计算,但在两种数据之间却存在着密切的联系,这就使得通过软件工程数据挖掘技术而得到的系统数据更具复杂性。
  2.2 挖掘结果的特殊性
  在传统的数据挖掘技术应用到软件测试工作后,其测试结果通常经由报表子系统的处理后,以图形或表格的形式呈现出来。但就软件工程数据挖掘技术而言,其所需要具备的功能不单是为用户提供相关测试结果,其更需要为用户提供符合或推翻结果的相关实例或软件缺陷定位方面的信息。
  2.3 挖掘结果的多元化评价
  数据信息挖掘结果具有多元化的评价或者相关测试、开发结果的评价难以统一是软件工程数据挖掘区别于传统数据挖掘的另一特点。对于传统的数据挖掘技术而言,对挖掘结果的评价已基本形成了统一的意见和评价标准,但就軟件工程数据挖掘而言,由于软件的开发人员和测试人员对数据信息的要求较为具体和严格,数据结果也具有较强的复杂性。因此,挖掘结果的评价方法也较为复杂。
  综上所述,如何将软件测试的结果和对测试阶段数据预处理方面的结果进行有效表述已成为当前软件工程数据挖掘技术应用的难点。所以,下文则着重从软件工程数据挖掘在软件测试阶段的应用方法展开了详细分析。
  3 软件工程数据挖掘在软件开发阶段的问题和解决对策
  3.1 重用代码
  开发者要了解所需的方法或者类,然后才能进行代码的重用,对相关代码进行浏览。这需要耗费过多的时间,可以在代码库中通过关键字来寻找可以重用的代码,这是由于可以重用的代码必然存在相似的模式,通过上下文结构可以呈现最终的结果,例如类与类的关系。首先要将具有上下文架构和例程的代码库构建出来。其次,开发者将类的信息提交到代码库,并对反馈结果打分,将代码库组建出来。第三,按照高低分来排序查询时的例程,开发者可以自行选用查询结果。
  3.2 重用静态规则
  利用软件工程数据挖掘来重用静态规则,开发者可以重复利用静态规则,在代码库中用类与类的关系的形式将其保存下来,可以用关联规则来发泄这种规则。首先,搜索代码库中内力的关系,在代码库中保存其与其余类的关系。其次,挖掘关联规则。可以使用Apriori算法来发现出现频率高的规则。第三,裁剪挖掘出的结果。也就是在筛选结中将无用的关联去掉,使开发者能够得到更为精炼的信息。第四,根据关联关系在代码库中出现的频率,用列表的形式呈现频率的排序。
  3.3 重用动态规则
  首先,开发者要制定动态规则的顺序。其次,将结果利用队列等简单的数据结构保存起来,开发者可以在编译器扩展中检查结果的顺序。第三,反馈违反规则的代码。
  在动态规则的具体重用过程中,由于开发者往往不能预先设定动态规则,因此,有研究提出了自动发现这种规则。自动发现规则主要是根据软件开发者的习惯性,以及违反规则可能出现的问题,发现两个事件发生的顺序。例如B事件必然发生在A事件之前,发现此类规则之后就可以规则设定为先后调用的相同函数,然后验证每一个规则,得出每个规则成立与否。由于可能会得到数量非常多的函数,为了降低函数的数目,可以使用一些函数命名规则,将不可能的函数对去除掉,然后再匹配剩下的函数对。
  4 结束语
  在软件工程的数据挖掘过程中,数据挖掘的概念才逐步被定义,但是所需要挖掘的数据是已经存在的。数据挖掘技术在软件工程中的运用能够降低研发人员的工作量,同时软件工程与数据挖掘的结合是计算机技术必然的发展方向。从数据挖掘的过程来讲,在其整个实施过程和周期中都包括软件工程。而对数据挖掘的技术手段来讲,它在软件工程中的运用更加普遍。在对数据挖掘技术的研究过程中可以发现,该技术虽然已经获得一定的效果,但是还有更多未被挖掘的空间,还需要进一步的研究和发现。
  参考文献:
  [1]马保平.关于对软件工程中的数据挖掘技术的探讨[J].电子技术与软件工程,2015,19:196-197.
  [2]黄世云.软件工程数据挖掘研究进展概述[J].电子技术与软件工程,2014,21:89.
  [3]魏敏.数据挖掘技术的持续改进[J].今日科技,2013(23).
  [4]徐巍,覃俊.数据挖掘技术在电力负荷管理系统中的应用[J].现代电子技术,2008(10).
其他文献
摘要:分析测试数据管理基本需求,实现了基于B/S架构、ExtJS框架的测试数据管理系统,具备数据管理、分析、二次开发接口等功能,用于多个产品的测试数据存储、管理,解决了批生产过程中测试数据管理困难的问题。  关键词:测试数据管理系统;ExtJS;二次开发  1引言  测试数据管理用于将测试现场数据按使用单位、产品代号、测试类型进行分类存储、管理,提供自动化的底层数据分析手段,分析产品趋势和底层故障
期刊
摘要:改革开放以来,中国的以飞速发展的状态,取得了举世瞩目的成就。实践证明,改革开放这个根据具体国情制定的基本国策是完全正确的。但是目前国际国内的环境发生巨大变化,改革带来了新的挑战和新的机遇。为此,深化对新时代全面深化改革的科学内涵的解析,具有重要的现实意义。  关键词:新时代全面深化改革;科学内涵;意义  一.新时代全面深化改革的背景  1、国内背景  回顾改革开放40周年,从十一届三中全会到
期刊
摘要:随着火驱井注空气井注入量逐年增加,油井尾气排量也逐年增大,套压升高,大大影响脱硫塔脱硫能力,增加了脱硫系统药剂成本。本文通过大量理论研究与现场实践,对脱硫系统进行不同现场管控规律摸索,分析了系统温度、压力等,通过对脱硫系统进行改造、优化脱硫系统运行方式,逐步使脱硫系统完善增强了脱硫能力,保障了火驱开发效果。  关键词:火驱井;脱硫;管控方法  引言  火驱井尾气处理系统是火驱开发的重点之一。
期刊
摘要:自21世纪以来,伴随着科学技术水平的快速发展,互联网以及信息化建设已经逐渐成熟,也开始尝试逐渐应用于基层工作的各个方面,这为建立信息化基层党建工作提供了更加便利和快捷的条件。  新时期,主动学习和适应信息化建设的快速发展是对基层党建工作的新要求。积极推进基层的信息化建设工作也是大势所趋,努力提高党建工作的科学化水准是对党在新时期工作的新考验。因此,加强基层党建工作的信息化是新时期基层工作的创
期刊
摘要:随着我国经济的不断发展,我国已经成为了世界第二大经济体,并且不断在向着世界头号经济体的目标迈进。在经济发展的同时,国家用电也得到了空前的大量需求。电能是保证一个国家健康长远发展的重要能源,在电能传输的过程当中需要各种变电站,来对电能进行转换和传输。其中35kV的变电站在我国的变电站数量中占有较大的比重。保证变电站能够进行正常的工作,在变电站元器件中设置继电保护是一种重要的保护手段。本文主要研
期刊
摘要:桥梁建筑工程为了能够确保质量和工程周期控制能力,需要将基础灌注桩施工作为主要的基础施工步骤,并通过合理的管控策略提升桥梁整体质量。本文在结合以往的施工经验和施工工艺技术之后,针对钻孔灌注桩的施工方法和材料使用技巧进行了全面的论述,同时在此基础之上,运用工程管理相关理论,对桥梁施工中钻孔灌注桩的施工质量控制提出了相应的要求,以此来提高桥梁施工的整体工艺水平。  关键词:建筑工程;桥梁;材料施工
期刊
摘要:城乡融合发展是实现城乡发展一体化的重要途径,也是新形势下城乡发展一体化的阶段性目标,但是这一目标的实现仍然需要面对大量的问题,本文从提高人口城镇化水平、促进城乡要素自由流动、推进城乡基本公共服务均等化、推动规模经营,消除城乡二元经济四个方面进行了探索。  关键词:创新;统筹;城乡融合  城市的发展离不开乡村,乡村的振兴与繁荣也离不开城市,城市与乡村地域相连、血脉相融。當前,我国社会的主要矛盾
期刊
摘要:党的十九大报告指出,牢牢掌握意识形态工作领导权。做好意识形态工作,关系到党的前途命运,关系到国家长治久安,关系到中华民族伟大复兴。把意识形态工作领导权牢牢把握在手中,是我们党的事业不断发展前进,夺取一个又一个胜利的重要思想政治保证。本文从巩固马克思主义意识形态理论的指导地位,牢牢把握新时代党对意识形态工作领导权和与现阶段各种错误社会思潮做斗争这三个角度探讨了对新时代社会主义意识形态建设创新的
期刊
摘要:本文主要对某厂百万机组的过热蒸汽喷水调节阀的应用进行了介绍,分析现场发生的内外泄漏故障的原因以及解决该类缺陷的方法,为处理类似缺陷提供一些解决方案,提高机组的安全经济性。  关健词:过热蒸汽喷水调节阀;缺陷;泄漏  0引言  长期以来,在火电厂机组运行中,减温水的控制调节一直是大难题。因该系统中调节阀的进出口压差大,对普通结构的调节阀会产生严重的汽蚀现象,汽蚀对阀芯阀座的破坏力很大,一旦发生
期刊
摘要:本系统中央处理器由市场上较为成熟的51单片机来承担,51单片机价格低廉操作简单,外围接口丰富,可以很好的实现系统的各项功能要求,键盘输入部分采用4*4矩阵键盘来实现,16个按键分别完成0-9数字的输入和加、减、乘、除、等号、5个计算键的功能,最后一个按键实现清除计算内容的功能,显示单元采用LCD1602液晶显示屏显示,液晶显示效果相比数码管更加稳定,无闪烁同时显示字符内容丰富。  关键词:计
期刊