论文部分内容阅读
摘要:近年来,信息技术的快速发展使得数据挖掘技术也在各个行业中获得了广泛的应用,并且数据挖掘技术也充分展现出了显著优势,推助许多行业的快速发展。计算机技术也已经成为人们生产生活中不可或缺的工具,而数据挖掘技术在计算机软件工程中的运用则具有现实意义。信息化时代下,以往的信息处理技术难以满足海量信息的处理和存储要求,数据挖掘技术的应用则很好地解决了这些问题,在软件工程中的运用能够将数据挖掘技术的优势全面发挥,在改善软件工程研发效率的同时也降低了管理成本。本文主要围绕软件工程中数据挖掘技术的运用展开论述,探讨了有关的应用策略。
关键词:数据挖掘技术;软件工程;应用对策
在大数据分析领域中,数据挖掘是一项新兴的概念,数据挖掘的关键便是针对数据量大且价值密度低的数据进行高效分析,从中提取出具有应用价值和研究价值的信息数据,从而进一步提高数据的应用率。软件工程经历了多年的发展,在软件开发与项目管理等方面也面临着数据分析的问题,如漏洞分析和源代码管理等。软件在长时间运作之下不断累积数据,但数据量越来越大的同时传统的处理手段无法实现全面处理,所以数据挖掘技术在软件工程中的有效应用成为当下研究的重点方向。
1 数据挖掘技术简介
数据挖掘技术属于现代化的信息处理技术,与传统的信息处理技术对比之下具有非常明显的功能性优势,因此也在许多行业中获得了普遍运用。目前在软件工程领域中,对于数据挖掘技术应用价值的研究仍然较少,很多软件工程都在沿用传统的数据处理技术,导致数据处理效率难以提升。而数据挖掘技术则包含了多种功能,不同功能之间也有着明显的联系性,可以实现全面评估,对于部分软件工程来说,数据挖掘技术的应用最明显的优势便在于数据处理效率获得了显著提升,同时数据丢失等问题也得到了很好的解决,对企业的发展带来了有效保障。
2 数据挖掘技术应用于软件工程的关键意义
2.1 有助于信息的获取
数据挖掘技术也包括传统信息处理中的各项重要功能,在完成信息采集工作后,可以按照数据信息的具体类型进行分类处理。在这一处理机制下,数据挖掘技术所涉及的业务范围也有了进一步的拓展,可以结合数据的具体特征进行分析,在海量数据资源中建立一个功能性完备的信息管理系统,可以帮助人们快速检索到需要的数据资源。将数据挖掘技术应用于软件工程中,也可以将许多信息进行整合处理,帮助企业快速掌握各方面数据信息。
2.2 信息的正确录入
数据挖掘技术的运算水平非常高,常规数据信息系统在运算过程中往往会需要较高的时间成本,并且部分情况下也可能由于数据处理量过高导致运算系统崩溃等问题。而数据挖掘技术的应用则可以有效避免这一问题,运算效率更高的同时在运算期间也能够进一步规避数据丢失或运算混乱等问题,加强数据处理的整体效果。对于大规模数据的运算来说,一些垃圾数据并没有利用价值,但可能会存储于数据处理系统中影响系统运作效率,数据挖掘技术的应用也可以将这些垃圾数据进行处理,将具有价值的信息录入到系统中。
2.3 提高数据处理效率
对于数据挖掘技术来说,数据转换也是最主要的优势之一,能够将混乱的数据信息进行整合处理,成为使用形式,而这些混乱的信息也可以在整合之后进行合理利用。杂数据挖掘过程中,可以自动选择合理的分析模式,针对模糊数据进行及时处理,使最后的数据结果能够全面利用。结合获取到的数据,从不同方向着手考查数据的真实性和价值,将真实地数据进行整合,让数据可读化,也就是将分析结果作为全新的知识以供参考。数据分析过程一般较为烦琐,需要对不同过程进行多次验证,才能获取真实的运算结果,而数据挖掘技术在软件工程中的有效应用则可以全面改善數据运算的效率与质量[1]。
3 数据挖掘技术在软件工程中的应用策略
3.1 信息挖掘
软件工程可以实现信息数据的全方位管控,而且软件工程的应用范围也非常广阔,在软件开发过程中需要涉及的信息类型多种多样,而软件工程的版本则可以对这些信息数据进行统一控制,确保软件在开发期间的各种数据资源都能进行同步更新,进一步确保软件开发的质量以及开发过程的效率性,让开发项目的目标能够顺利实现。在数据挖掘过程中,包括软件开发更替的数据,技术人员可以快速区别软件的内部结构,并且还可以充分应用数据挖掘技术的优势,在后续的工作中能够迅速找出软件内部问题并解决,完成软件开发任务。
3.2 软件漏洞检测
在软件工程中,漏洞检测作为其中不可或缺的工作内容,可以确保软件开发质量和系统的安全运作,及时发现隐患并及时排除隐患。软件漏洞的快速修复可以为用户提供更加稳定的保障。在数据挖掘技术的应用方面,漏洞检测中不但要针对软件进行基本的测试内容,而且也应当进行相关性检测,与软件漏洞有关的项目内容也应该进行全面检测,才能满足软件开发的现实要求。数据挖掘技术可以结合所记录的内容来分析数据,针对分析结果进行改进,之后再决定选择哪种测试模式完成测试工作,确保测试模式的选择更加符合软件工程的现实需求。在漏洞数据的处理方面,数据挖掘技术需要先清理掉数据,之后利用相关的数据进行分析和提取,清除掉没有应用价值的数据,再对缺失的部分内容进行补充,以数据的方式呈现出来。除此之外,数据挖掘技术在软件漏洞中的运用需要选择合理有效的数据模型来完成分析与验证工作,尽量选择可行的挖掘模式,使其成为测试集。具有关联的系统也需要针对运算结果进行类比,选择最为合理的结果。在漏洞检测中,还要对软件漏洞进行分类与描述,在数据库中及时更新软件漏洞数据,如此一来但凡其他的相关软件或系统在遭遇相似问题时便可以及时从数据库中调取数据,从而进行快速操作,降低漏洞检测所需时间的同时也为漏洞的检测与解决提供参考依据,因此在漏洞数据更新方面也要保证数据分类的合理性[2]。
3.3 开源软件的数据挖掘 对于软件工程来说,开源软件是最主要的数据挖掘目标,克隆代码检测在其中具有关键的作用和意义,而且在源文件开发工作中也有着非常普遍的运用,可以快速进行数据拷贝和数据复制。克隆代码技术还可以进一步改善代码拷贝与代码粘贴的效率性,也有助于代码检测工作的快速实现,进一步规避了软件工程系统受代码漏洞的影响,改善软件系统后期维护工作,为其提供更为有利的开展条件。但开源软件的数据挖掘项目也有一定的影响因素,如环境的开放型与动态性特征便会带来一定影响,尤其是软件的开发与管理方面,都和传统的软件开发存在明显不同。而一些技术较为完善的开源软件,大多会将错误报告和软件应用情况、开发者有关信息等进行记录,帮助开发人员快速建立典型社会网络,根据开发的特征,快速了解并掌握网络的动态变化。除此之外工作人员还需要进一步挖掘开源软件的动态性,加强开源项目管理的整体效果。
3.4 执行记录的数据挖掘
执行记录的数据挖掘也是软件工程数据挖掘中的关键内容,通过软件系统执行路径的有效分析可以帮助工作人员掌握软件工程中不同系统模块工作代码间存在的联系性。执行记录挖掘运行工作也是通过跟踪软件来进行逆向建模的过程,可以改善软件工作系统的理解、跟踪、维护等方面的有效性。而在挖掘执行记录数据期间,还要重点分析程序执行的主要过程,有利于掌握程序代码之间存在的关联性,在应用过程执行记录实际挖掘期间需要分析工作系统的具体情况,运用挖掘软件来做到应用编程的结构工作,记录号各方面的系统信息,建立系统的功能模块。
4 数据挖掘技术的应用方法
4.1 分类法
一般情况下,数据挖掘技术包括许多种分类方式,一般存在于同种预测分类标号的执行动作。在软件工程中,通常需要利用建立对应分析模型的方式,提前根据有关流程和规范输入数据信息,将其作为分析模式应用数据。目前数据挖掘技术在软件工程应用的方法之中,广泛应用的分类法包括判断书法、神经网络分类法、判断树法等。判断树法的应用通常需要将贪心算法作为核心逻辑,以从上到下的顺序建立一个判定树框架,判定树一般具有很多各子节点,这些子节点分别对应不同的软件类别符号[3]。
4.2 聚类法
聚类法一般会在探究过程中包含的多种数据,结合有关标准实现细化处理,将其细化为不同类型的流程,从而保证同种类型目标间具有高度的相似性,并且还可以让各个类型对象间具有一定的区别性。聚类法和分类法具有明显不同,聚类法在应用过程中,划分对象一般具有不可预见性,所以主要以无指导学习模式为主,聚类分析法在其他算法处理中的应用范围也十分广泛,尤其是分析數据的独立性方面优势更加明显,不仅可以进一步挖掘数据孤立点,而且还可以有效改善检测的效率性与可靠性。
4.3 关联法
关联法的实际应用对于人为操作具有一定要求,工作人员和系统需要把数据中心具有的关联数据找出并分类区别,关联法的应用特征体现在数据的相关关联,所以数据关联至关重要,而关联法的主要优势在于较高的置信度[4]。
5 结束语
在软件工程中,软件技术一般具有明显的复杂性和系统化特征,因此数据挖掘技术的应用具有关键的现实意义,可以为软件开发带来可靠支持。根据目前的发展现状来看,数据挖掘技术虽然经过了多年的发展,但仍然不够成熟,这也需要学者们进行深入研究,在提高数据挖掘技术应用率的同时推动数据挖掘技术的快速发展,也不断探索数据挖掘技术的创新路径。
参考文献:
[1] 李金召.数据挖掘技术在软件工程中的应用与研究[J].计算机产品与流通,2020(5):30.
[2] 程志平,徐涢基.数据挖掘技术在软件工程中的应用探究[J].信息技术与信息化,2018(12):210-212.
[3] 张立鉴.数据挖掘技术在软件工程中的应用研究[J].网络安全技术与应用,2019(6):47-48.
[4] 李红兰.试论数据挖掘技术在软件工程中的应用综述[J].电脑知识与技术,2016,12(34):98-99.
【通联编辑:梁书】
关键词:数据挖掘技术;软件工程;应用对策
在大数据分析领域中,数据挖掘是一项新兴的概念,数据挖掘的关键便是针对数据量大且价值密度低的数据进行高效分析,从中提取出具有应用价值和研究价值的信息数据,从而进一步提高数据的应用率。软件工程经历了多年的发展,在软件开发与项目管理等方面也面临着数据分析的问题,如漏洞分析和源代码管理等。软件在长时间运作之下不断累积数据,但数据量越来越大的同时传统的处理手段无法实现全面处理,所以数据挖掘技术在软件工程中的有效应用成为当下研究的重点方向。
1 数据挖掘技术简介
数据挖掘技术属于现代化的信息处理技术,与传统的信息处理技术对比之下具有非常明显的功能性优势,因此也在许多行业中获得了普遍运用。目前在软件工程领域中,对于数据挖掘技术应用价值的研究仍然较少,很多软件工程都在沿用传统的数据处理技术,导致数据处理效率难以提升。而数据挖掘技术则包含了多种功能,不同功能之间也有着明显的联系性,可以实现全面评估,对于部分软件工程来说,数据挖掘技术的应用最明显的优势便在于数据处理效率获得了显著提升,同时数据丢失等问题也得到了很好的解决,对企业的发展带来了有效保障。
2 数据挖掘技术应用于软件工程的关键意义
2.1 有助于信息的获取
数据挖掘技术也包括传统信息处理中的各项重要功能,在完成信息采集工作后,可以按照数据信息的具体类型进行分类处理。在这一处理机制下,数据挖掘技术所涉及的业务范围也有了进一步的拓展,可以结合数据的具体特征进行分析,在海量数据资源中建立一个功能性完备的信息管理系统,可以帮助人们快速检索到需要的数据资源。将数据挖掘技术应用于软件工程中,也可以将许多信息进行整合处理,帮助企业快速掌握各方面数据信息。
2.2 信息的正确录入
数据挖掘技术的运算水平非常高,常规数据信息系统在运算过程中往往会需要较高的时间成本,并且部分情况下也可能由于数据处理量过高导致运算系统崩溃等问题。而数据挖掘技术的应用则可以有效避免这一问题,运算效率更高的同时在运算期间也能够进一步规避数据丢失或运算混乱等问题,加强数据处理的整体效果。对于大规模数据的运算来说,一些垃圾数据并没有利用价值,但可能会存储于数据处理系统中影响系统运作效率,数据挖掘技术的应用也可以将这些垃圾数据进行处理,将具有价值的信息录入到系统中。
2.3 提高数据处理效率
对于数据挖掘技术来说,数据转换也是最主要的优势之一,能够将混乱的数据信息进行整合处理,成为使用形式,而这些混乱的信息也可以在整合之后进行合理利用。杂数据挖掘过程中,可以自动选择合理的分析模式,针对模糊数据进行及时处理,使最后的数据结果能够全面利用。结合获取到的数据,从不同方向着手考查数据的真实性和价值,将真实地数据进行整合,让数据可读化,也就是将分析结果作为全新的知识以供参考。数据分析过程一般较为烦琐,需要对不同过程进行多次验证,才能获取真实的运算结果,而数据挖掘技术在软件工程中的有效应用则可以全面改善數据运算的效率与质量[1]。
3 数据挖掘技术在软件工程中的应用策略
3.1 信息挖掘
软件工程可以实现信息数据的全方位管控,而且软件工程的应用范围也非常广阔,在软件开发过程中需要涉及的信息类型多种多样,而软件工程的版本则可以对这些信息数据进行统一控制,确保软件在开发期间的各种数据资源都能进行同步更新,进一步确保软件开发的质量以及开发过程的效率性,让开发项目的目标能够顺利实现。在数据挖掘过程中,包括软件开发更替的数据,技术人员可以快速区别软件的内部结构,并且还可以充分应用数据挖掘技术的优势,在后续的工作中能够迅速找出软件内部问题并解决,完成软件开发任务。
3.2 软件漏洞检测
在软件工程中,漏洞检测作为其中不可或缺的工作内容,可以确保软件开发质量和系统的安全运作,及时发现隐患并及时排除隐患。软件漏洞的快速修复可以为用户提供更加稳定的保障。在数据挖掘技术的应用方面,漏洞检测中不但要针对软件进行基本的测试内容,而且也应当进行相关性检测,与软件漏洞有关的项目内容也应该进行全面检测,才能满足软件开发的现实要求。数据挖掘技术可以结合所记录的内容来分析数据,针对分析结果进行改进,之后再决定选择哪种测试模式完成测试工作,确保测试模式的选择更加符合软件工程的现实需求。在漏洞数据的处理方面,数据挖掘技术需要先清理掉数据,之后利用相关的数据进行分析和提取,清除掉没有应用价值的数据,再对缺失的部分内容进行补充,以数据的方式呈现出来。除此之外,数据挖掘技术在软件漏洞中的运用需要选择合理有效的数据模型来完成分析与验证工作,尽量选择可行的挖掘模式,使其成为测试集。具有关联的系统也需要针对运算结果进行类比,选择最为合理的结果。在漏洞检测中,还要对软件漏洞进行分类与描述,在数据库中及时更新软件漏洞数据,如此一来但凡其他的相关软件或系统在遭遇相似问题时便可以及时从数据库中调取数据,从而进行快速操作,降低漏洞检测所需时间的同时也为漏洞的检测与解决提供参考依据,因此在漏洞数据更新方面也要保证数据分类的合理性[2]。
3.3 开源软件的数据挖掘 对于软件工程来说,开源软件是最主要的数据挖掘目标,克隆代码检测在其中具有关键的作用和意义,而且在源文件开发工作中也有着非常普遍的运用,可以快速进行数据拷贝和数据复制。克隆代码技术还可以进一步改善代码拷贝与代码粘贴的效率性,也有助于代码检测工作的快速实现,进一步规避了软件工程系统受代码漏洞的影响,改善软件系统后期维护工作,为其提供更为有利的开展条件。但开源软件的数据挖掘项目也有一定的影响因素,如环境的开放型与动态性特征便会带来一定影响,尤其是软件的开发与管理方面,都和传统的软件开发存在明显不同。而一些技术较为完善的开源软件,大多会将错误报告和软件应用情况、开发者有关信息等进行记录,帮助开发人员快速建立典型社会网络,根据开发的特征,快速了解并掌握网络的动态变化。除此之外工作人员还需要进一步挖掘开源软件的动态性,加强开源项目管理的整体效果。
3.4 执行记录的数据挖掘
执行记录的数据挖掘也是软件工程数据挖掘中的关键内容,通过软件系统执行路径的有效分析可以帮助工作人员掌握软件工程中不同系统模块工作代码间存在的联系性。执行记录挖掘运行工作也是通过跟踪软件来进行逆向建模的过程,可以改善软件工作系统的理解、跟踪、维护等方面的有效性。而在挖掘执行记录数据期间,还要重点分析程序执行的主要过程,有利于掌握程序代码之间存在的关联性,在应用过程执行记录实际挖掘期间需要分析工作系统的具体情况,运用挖掘软件来做到应用编程的结构工作,记录号各方面的系统信息,建立系统的功能模块。
4 数据挖掘技术的应用方法
4.1 分类法
一般情况下,数据挖掘技术包括许多种分类方式,一般存在于同种预测分类标号的执行动作。在软件工程中,通常需要利用建立对应分析模型的方式,提前根据有关流程和规范输入数据信息,将其作为分析模式应用数据。目前数据挖掘技术在软件工程应用的方法之中,广泛应用的分类法包括判断书法、神经网络分类法、判断树法等。判断树法的应用通常需要将贪心算法作为核心逻辑,以从上到下的顺序建立一个判定树框架,判定树一般具有很多各子节点,这些子节点分别对应不同的软件类别符号[3]。
4.2 聚类法
聚类法一般会在探究过程中包含的多种数据,结合有关标准实现细化处理,将其细化为不同类型的流程,从而保证同种类型目标间具有高度的相似性,并且还可以让各个类型对象间具有一定的区别性。聚类法和分类法具有明显不同,聚类法在应用过程中,划分对象一般具有不可预见性,所以主要以无指导学习模式为主,聚类分析法在其他算法处理中的应用范围也十分广泛,尤其是分析數据的独立性方面优势更加明显,不仅可以进一步挖掘数据孤立点,而且还可以有效改善检测的效率性与可靠性。
4.3 关联法
关联法的实际应用对于人为操作具有一定要求,工作人员和系统需要把数据中心具有的关联数据找出并分类区别,关联法的应用特征体现在数据的相关关联,所以数据关联至关重要,而关联法的主要优势在于较高的置信度[4]。
5 结束语
在软件工程中,软件技术一般具有明显的复杂性和系统化特征,因此数据挖掘技术的应用具有关键的现实意义,可以为软件开发带来可靠支持。根据目前的发展现状来看,数据挖掘技术虽然经过了多年的发展,但仍然不够成熟,这也需要学者们进行深入研究,在提高数据挖掘技术应用率的同时推动数据挖掘技术的快速发展,也不断探索数据挖掘技术的创新路径。
参考文献:
[1] 李金召.数据挖掘技术在软件工程中的应用与研究[J].计算机产品与流通,2020(5):30.
[2] 程志平,徐涢基.数据挖掘技术在软件工程中的应用探究[J].信息技术与信息化,2018(12):210-212.
[3] 张立鉴.数据挖掘技术在软件工程中的应用研究[J].网络安全技术与应用,2019(6):47-48.
[4] 李红兰.试论数据挖掘技术在软件工程中的应用综述[J].电脑知识与技术,2016,12(34):98-99.
【通联编辑:梁书】