关于数据挖掘技术在软件工程中的应用分析

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:anying_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:近年来,信息技术的快速发展使得数据挖掘技术也在各个行业中获得了广泛的应用,并且数据挖掘技术也充分展现出了显著优势,推助许多行业的快速发展。计算机技术也已经成为人们生产生活中不可或缺的工具,而数据挖掘技术在计算机软件工程中的运用则具有现实意义。信息化时代下,以往的信息处理技术难以满足海量信息的处理和存储要求,数据挖掘技术的应用则很好地解决了这些问题,在软件工程中的运用能够将数据挖掘技术的优势全面发挥,在改善软件工程研发效率的同时也降低了管理成本。本文主要围绕软件工程中数据挖掘技术的运用展开论述,探讨了有关的应用策略。
  关键词:数据挖掘技术;软件工程;应用对策
  在大数据分析领域中,数据挖掘是一项新兴的概念,数据挖掘的关键便是针对数据量大且价值密度低的数据进行高效分析,从中提取出具有应用价值和研究价值的信息数据,从而进一步提高数据的应用率。软件工程经历了多年的发展,在软件开发与项目管理等方面也面临着数据分析的问题,如漏洞分析和源代码管理等。软件在长时间运作之下不断累积数据,但数据量越来越大的同时传统的处理手段无法实现全面处理,所以数据挖掘技术在软件工程中的有效应用成为当下研究的重点方向。
  1 数据挖掘技术简介
  数据挖掘技术属于现代化的信息处理技术,与传统的信息处理技术对比之下具有非常明显的功能性优势,因此也在许多行业中获得了普遍运用。目前在软件工程领域中,对于数据挖掘技术应用价值的研究仍然较少,很多软件工程都在沿用传统的数据处理技术,导致数据处理效率难以提升。而数据挖掘技术则包含了多种功能,不同功能之间也有着明显的联系性,可以实现全面评估,对于部分软件工程来说,数据挖掘技术的应用最明显的优势便在于数据处理效率获得了显著提升,同时数据丢失等问题也得到了很好的解决,对企业的发展带来了有效保障。
  2 数据挖掘技术应用于软件工程的关键意义
  2.1 有助于信息的获取
  数据挖掘技术也包括传统信息处理中的各项重要功能,在完成信息采集工作后,可以按照数据信息的具体类型进行分类处理。在这一处理机制下,数据挖掘技术所涉及的业务范围也有了进一步的拓展,可以结合数据的具体特征进行分析,在海量数据资源中建立一个功能性完备的信息管理系统,可以帮助人们快速检索到需要的数据资源。将数据挖掘技术应用于软件工程中,也可以将许多信息进行整合处理,帮助企业快速掌握各方面数据信息。
  2.2 信息的正确录入
  数据挖掘技术的运算水平非常高,常规数据信息系统在运算过程中往往会需要较高的时间成本,并且部分情况下也可能由于数据处理量过高导致运算系统崩溃等问题。而数据挖掘技术的应用则可以有效避免这一问题,运算效率更高的同时在运算期间也能够进一步规避数据丢失或运算混乱等问题,加强数据处理的整体效果。对于大规模数据的运算来说,一些垃圾数据并没有利用价值,但可能会存储于数据处理系统中影响系统运作效率,数据挖掘技术的应用也可以将这些垃圾数据进行处理,将具有价值的信息录入到系统中。
  2.3 提高数据处理效率
  对于数据挖掘技术来说,数据转换也是最主要的优势之一,能够将混乱的数据信息进行整合处理,成为使用形式,而这些混乱的信息也可以在整合之后进行合理利用。杂数据挖掘过程中,可以自动选择合理的分析模式,针对模糊数据进行及时处理,使最后的数据结果能够全面利用。结合获取到的数据,从不同方向着手考查数据的真实性和价值,将真实地数据进行整合,让数据可读化,也就是将分析结果作为全新的知识以供参考。数据分析过程一般较为烦琐,需要对不同过程进行多次验证,才能获取真实的运算结果,而数据挖掘技术在软件工程中的有效应用则可以全面改善數据运算的效率与质量[1]。
  3 数据挖掘技术在软件工程中的应用策略
  3.1 信息挖掘
  软件工程可以实现信息数据的全方位管控,而且软件工程的应用范围也非常广阔,在软件开发过程中需要涉及的信息类型多种多样,而软件工程的版本则可以对这些信息数据进行统一控制,确保软件在开发期间的各种数据资源都能进行同步更新,进一步确保软件开发的质量以及开发过程的效率性,让开发项目的目标能够顺利实现。在数据挖掘过程中,包括软件开发更替的数据,技术人员可以快速区别软件的内部结构,并且还可以充分应用数据挖掘技术的优势,在后续的工作中能够迅速找出软件内部问题并解决,完成软件开发任务。
  3.2 软件漏洞检测
  在软件工程中,漏洞检测作为其中不可或缺的工作内容,可以确保软件开发质量和系统的安全运作,及时发现隐患并及时排除隐患。软件漏洞的快速修复可以为用户提供更加稳定的保障。在数据挖掘技术的应用方面,漏洞检测中不但要针对软件进行基本的测试内容,而且也应当进行相关性检测,与软件漏洞有关的项目内容也应该进行全面检测,才能满足软件开发的现实要求。数据挖掘技术可以结合所记录的内容来分析数据,针对分析结果进行改进,之后再决定选择哪种测试模式完成测试工作,确保测试模式的选择更加符合软件工程的现实需求。在漏洞数据的处理方面,数据挖掘技术需要先清理掉数据,之后利用相关的数据进行分析和提取,清除掉没有应用价值的数据,再对缺失的部分内容进行补充,以数据的方式呈现出来。除此之外,数据挖掘技术在软件漏洞中的运用需要选择合理有效的数据模型来完成分析与验证工作,尽量选择可行的挖掘模式,使其成为测试集。具有关联的系统也需要针对运算结果进行类比,选择最为合理的结果。在漏洞检测中,还要对软件漏洞进行分类与描述,在数据库中及时更新软件漏洞数据,如此一来但凡其他的相关软件或系统在遭遇相似问题时便可以及时从数据库中调取数据,从而进行快速操作,降低漏洞检测所需时间的同时也为漏洞的检测与解决提供参考依据,因此在漏洞数据更新方面也要保证数据分类的合理性[2]。
  3.3 开源软件的数据挖掘   对于软件工程来说,开源软件是最主要的数据挖掘目标,克隆代码检测在其中具有关键的作用和意义,而且在源文件开发工作中也有着非常普遍的运用,可以快速进行数据拷贝和数据复制。克隆代码技术还可以进一步改善代码拷贝与代码粘贴的效率性,也有助于代码检测工作的快速实现,进一步规避了软件工程系统受代码漏洞的影响,改善软件系统后期维护工作,为其提供更为有利的开展条件。但开源软件的数据挖掘项目也有一定的影响因素,如环境的开放型与动态性特征便会带来一定影响,尤其是软件的开发与管理方面,都和传统的软件开发存在明显不同。而一些技术较为完善的开源软件,大多会将错误报告和软件应用情况、开发者有关信息等进行记录,帮助开发人员快速建立典型社会网络,根据开发的特征,快速了解并掌握网络的动态变化。除此之外工作人员还需要进一步挖掘开源软件的动态性,加强开源项目管理的整体效果。
  3.4 执行记录的数据挖掘
  执行记录的数据挖掘也是软件工程数据挖掘中的关键内容,通过软件系统执行路径的有效分析可以帮助工作人员掌握软件工程中不同系统模块工作代码间存在的联系性。执行记录挖掘运行工作也是通过跟踪软件来进行逆向建模的过程,可以改善软件工作系统的理解、跟踪、维护等方面的有效性。而在挖掘执行记录数据期间,还要重点分析程序执行的主要过程,有利于掌握程序代码之间存在的关联性,在应用过程执行记录实际挖掘期间需要分析工作系统的具体情况,运用挖掘软件来做到应用编程的结构工作,记录号各方面的系统信息,建立系统的功能模块。
  4 数据挖掘技术的应用方法
  4.1 分类法
  一般情况下,数据挖掘技术包括许多种分类方式,一般存在于同种预测分类标号的执行动作。在软件工程中,通常需要利用建立对应分析模型的方式,提前根据有关流程和规范输入数据信息,将其作为分析模式应用数据。目前数据挖掘技术在软件工程应用的方法之中,广泛应用的分类法包括判断书法、神经网络分类法、判断树法等。判断树法的应用通常需要将贪心算法作为核心逻辑,以从上到下的顺序建立一个判定树框架,判定树一般具有很多各子节点,这些子节点分别对应不同的软件类别符号[3]。
  4.2 聚类法
  聚类法一般会在探究过程中包含的多种数据,结合有关标准实现细化处理,将其细化为不同类型的流程,从而保证同种类型目标间具有高度的相似性,并且还可以让各个类型对象间具有一定的区别性。聚类法和分类法具有明显不同,聚类法在应用过程中,划分对象一般具有不可预见性,所以主要以无指导学习模式为主,聚类分析法在其他算法处理中的应用范围也十分广泛,尤其是分析數据的独立性方面优势更加明显,不仅可以进一步挖掘数据孤立点,而且还可以有效改善检测的效率性与可靠性。
  4.3 关联法
  关联法的实际应用对于人为操作具有一定要求,工作人员和系统需要把数据中心具有的关联数据找出并分类区别,关联法的应用特征体现在数据的相关关联,所以数据关联至关重要,而关联法的主要优势在于较高的置信度[4]。
  5 结束语
  在软件工程中,软件技术一般具有明显的复杂性和系统化特征,因此数据挖掘技术的应用具有关键的现实意义,可以为软件开发带来可靠支持。根据目前的发展现状来看,数据挖掘技术虽然经过了多年的发展,但仍然不够成熟,这也需要学者们进行深入研究,在提高数据挖掘技术应用率的同时推动数据挖掘技术的快速发展,也不断探索数据挖掘技术的创新路径。
  参考文献:
  [1] 李金召.数据挖掘技术在软件工程中的应用与研究[J].计算机产品与流通,2020(5):30.
  [2] 程志平,徐涢基.数据挖掘技术在软件工程中的应用探究[J].信息技术与信息化,2018(12):210-212.
  [3] 张立鉴.数据挖掘技术在软件工程中的应用研究[J].网络安全技术与应用,2019(6):47-48.
  [4] 李红兰.试论数据挖掘技术在软件工程中的应用综述[J].电脑知识与技术,2016,12(34):98-99.
  【通联编辑:梁书】
其他文献
针对传统篮球场景分割方法鲁棒性弱和分割精度不高的问题,以篮球场景分割和运动员精确定位目的,提出了一种基于DeepLabv3+改进的篮球场景语义分割模型。该模型在DeepLabv3+网络的基础上设计了一个相对复杂的解码器,使用多次特征融合的方式来更好的还原图像的语义信息,引入了卷积块注意力机制,优化了通道权重和位置信息,降低了模型的计算复杂度,提升了边缘敏感度。实验结果表明,本文的模型要比FCN的全
摘要:在无线传感器网络中,由于节点间能量消耗不平衡导致网络过早死亡。为了解决这一问题,提出一种基于非均匀分簇的路由协议NCRP。首先,在选举候选簇头的过程中加入节点的能量因子改进阈值公式。其次,在计算簇头竞争半径时加入节点度因子和距离因子。最后,在数据传输节点定义了能耗函数。仿真结果表明,NCRP协议可以均衡网络能耗,延长网络生存时间。  关键词:无线传感器网络;非均匀分簇;路由协议;剩余能量;邻
摘要:随着世界步入大数据时代,运用大数据、人工智能、信息平台等信息技术思考问题、解决困难成为一种趋势。在社会发生大变革之际,公共安全维护工作也面临着诸多挑战,而新的维护工作为这些创新技术提供新的应用平台。同时,新阶段在创新技术、治理结构方面发生巨大改变,以此推动政府管理工作、社会治理活动的改变,帮助政府快速改变管理策略,有效应对新的危机和问题。因此在新时代,应以新信息技术应用为研究对象,不断完善公
摘要:在社会经济的发展过程中,计算机技术起到了重要的推动作用。但是如同其他事物一样,计算机技术也存在着自身的不足,突出表现为数据信息的安全风险。为了在最大程度上发挥计算机技术的价值,避免其所产生的负面影响,对计算机网络数据库安全管理技术的探究便成为极为关键的因素。  关键词:计算机技术;安全风险;安全管理  中图分类号:TP311 文献标识码:A  文章编号:1009-3044(2021)23
摘要:国内大多数高校的《计算机网络》教材,在介绍计算机网络基本原理分组交换技术时,给出相同的总时延公式,对该公式进行了探讨,提出其修正公式及分析。  关键词: 关总时延公式;计算机网络  Abstract: When introducing the basic principle of computer network and packet switching technology, the sa
摘要:在互联网技术与信息技术飞速发展的时代背景下,使得人们在生活、学习、工作等多方面对信息技术的依赖越来越强,因此也加速了计算机技术与信息技术的发展与新的突破。计算机数据库系统是从信息技术系统中衍生出来的,是信息技术系统中的重要组成部分。计算机数据库系统是如何高效、有组织地进行数据的存储,在企业的信息化建设进程中,起着重要的作用。本文从信息技术、计算机数据库系统、信息管理的重要性等方面进行了深入的
摘要:文章用Cox比例风险模型对心力衰竭的影响因素进行了数据分析,研究结论显示,影响心力衰竭的主要因素是年龄、射血分数、高血压情况、血清肌酐浓度。根据模型我们可以帮助医疗专业人员了解患者存在的潜在风险,以便专业人员能够更早地采取行动。  关键词:Cox比例风险模型;Schoenfeld残差分析;心力衰竭影响因素  心力衰竭是指人体心脏的收缩功能的减退以及舒张功能受阻,不能很好地将静脉回心血量排到心
摘要:针对目前数据库课程体系中数据库设计与优化的教学内容和方法不足等问题,探索基于工程教育专业认证的教学改革措施。明确数据库课程体系培养目标,科学规划教学内容,精心设计教学案例,重点采用案例启发式教学方法。教学效果表明提高了学生的学习积极性,增强了学生对知识点的理解,锻炼了学生解决复杂工程问题的实践能力,为工程教育认证背景下数据库课程体系的教学改革和探索提供参考。  关键词:数据库课程;复杂工程问
摘要:全球新冠肺炎疫情正处于攻坚阶段,我国在疫情防控中为全球提供了中国防控和诊疗方案,疫情期间的入院信息登记为降低传播风险提供了有益探索。本文首先阐述了入院信息登记系统所采用的热成像、数据库、信息通信、云平台等核心技术,然后从总体技术要求、系统登录管控、登记基本信息、基本功能操作、拓展功能操作等方面论述了入院信息登记系统的功能框架,最后分析了入院信息登记系统疾病关联分析、慢病远程服务和行为异常检测
摘要:伴随着信息化产业发展,信息化建设成为高校突破传统管理,推动现代化治理的新动力。另外,大数据时代开启了新的变革,为促进高校发展的方式是充分利用互联网、物联网等信息化手段,有机地将学生的学习、生活和教师的工作相融合,更加有效快速地为师生服务,发展智慧校园的模式[1]。值得探讨的是,在当今信息安全事故频发的背景下,信息化建设带来发展的同时,安全运维人员对各类主机资源、应用系统的管理及数据安全的治理