数据挖掘技术在软件工程的应用探索

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:xianyekong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]当前是信息化的大数据时代,人们每天都生活在大量的数据中,生活和工作中信息无处不在,但如何能够在海量信息中定位自己的需求信息是现代人关注的焦。数据挖掘技术很好的解决了这个问题,不仅能够实现信息的定位还能在短时间内完成,大大的缩短了处理数据的时间。本文就以数据挖掘技术为中心点,首先对其概念进行简单的阐述,之后在此基础上分析了软件工程中的应用,以期能为相关专业的技术人员提供一定的技术参考。
  [关键词]数据挖掘技术;软件工程;应用
  中图分类号:TP311.5 文献标识码:A 文章编号:1009-914X(2016)17-0267-01
  1.数据挖掘技术概述
  所谓数据挖掘,主要指的是在大量的数据信息中利用科学、有效的算法第一时间获取到有用信息的筛选过程。大量的信息存在于生产和生活领域,使得人们在处理事情是无从下手,这样大大降低了人们的工作效率,也浪费了工作人员宝贵的时间。而这一问题通过数据挖掘技术的使用得到了很好的解决。
  1.1 数据挖掘技术所采用的方法
  在具体的操作中,数据挖掘技术会通过很多方法来使任务得以完成。具体的方法有如下几种:
  1.1.1 遗传算法的使用
  所谓遗传算法,主要是指基于生物自然选择与遗传激励的随机搜索算法,也是数据挖掘技术常用的一种操作方法[1]。遗传算法的有点就在于表面上看似无联系的事物,却能在事物模型间建立相关的练习,实现事物之间共同发展,现在生物界越来越重视的遗传基因等的研究,所以这种方法很受人们的欢迎。
  1.1.2 采用决策树方法
  这种方法主要用于对信息的分类和整合,在遇到大量的信息的时候,能够在短时间内找出关键的信息,能够使信息分类的快速化和简单化,并且保证了信息分类的准确度,但是此方法的不足之处就在于具有较差的抗噪性能,不能全面的来表述较为复杂的概念。
  1.1.3 采用统计分析法
  往往会利用回归分析和主成分分析等方法来分析数据库字段之间的关系。在字段之间的关系包括相关关系,函数关系也是其中的一种,不同的是函数关系可以用公式来表示,而相关关系则不能通过公示来表示关系,系统分析法的使用为这种关系的分析提供了便利。
  1.1.4 采用可视化技术
  可视化技术是采用一些图表来对数据进行表现,便于对数据的理解,比如,使用简单图形来展示存在于数据库中的多个数据,使研究者看起来一目了然,使单调的数据形象化,更容易掌握数据的相关信息。
  1.1.5 采用神经网络方法
  它模拟人脑神经元结构,以 MP 模型和Hebb学习规则为基础,用神经网络连接的权值表示知识,其学习体现在神经网络权值的逐步计算上。前馈式网络、反馈式网络和自组织网络是常用的三种神经网络模型,分别用于预测、联想记忆和聚类等。
  2.数据挖掘技术在软件工程中的应用
  2.1关于程序代码及结构方面的挖掘
  ①克隆代码检测的方法。克隆代码主要指的是根据软件工程运行需求,对某一代码段进行复制、粘贴,若有特殊需求,也可以对部分代码进行适当更改,对于上述代码的检测主要是为了避免故障传播,对系统进行简要维护,以此来满足软件系统运行需求。目前,克隆代码检测的方法主要包括4种,即文本对比、标识符对比、度量和程序结构[2]。每一种检测方法都有其不同的检测流程和判断依据,需要结合实际情况选取最佳的检测方法。
  ②Aspect 挖掘。Aspect 挖掘就是我们常说的横切关注点挖掘,在软件工程系统中,Aspect 挖掘是系统改造成面向方面软件所必须要处理好的重要问题。在此项问题的处理中,可供采用的方法有很多,最具针对性的就是度量分析法和形式概念分析法。上述两种方法可以利用候选集的重构将横切点关注挖掘相关问题有效解决。实际上,数据挖掘技术还可以在很多方面产生不错的影响。
  ③代码检索。在软件开发方法学中提倡着复用这个重要的原则,近年来有一个软件复用这方面领域里的很重重要的议题,也就是关于在本地或者是面向 WEB 这些代码库中检索出符合现阶段项目的代码之类的议题,已经出现了几种比较有代代表性的方式,比如分类存储并检索、基于输入-输出映射的检索、基于构件形式化描述、基于代码相似性等等方法,这些方式主要会涉及到有关于聚类、分类、语义分析等等几种比较主要的技术。由于其Web的应用范围不断的扩大,也就不再单单只有文档在其中,还有许多犹如 Google Cod 以及 Mica 等等类型的代码搜索引擎也随着那些 Web 中的可供参考的代码而出现
  2.2软件项目管理中数据挖掘技术的应用
  数据挖掘技术在项目管理中的应用主要体现在两个方面,即对组织关系的挖掘和对版本控制信息的挖掘。由于软件项目管理是一个全面而又系统的工程,因此,有关组织关系的挖掘包含了多个方面的内容,最主要的就是对人力资源的有效协调和分配。另一方面是对版本控制信息的挖掘,版本信息控制的功能主要是为工作人员查看版本信息提供方便,数据挖掘技术在此方面的应用一方面可以自动对系统修复情况进行检测,并在此基础上为系统提供警示作用,另一方面则可以避开很多常见错误,确保系统正常运行,以此来提高软件项目管理水平。
  2.3故障检测中数据挖掘技术的应用
  在软件工程系统不断优化与完善的今天,势必要对故障检测方法进行改进。数据挖掘技术的应用充分满足了这一需求。数据挖掘技术对故障的检测主要是从两个方面展开,分别为程序说明和交互模式。对程序说明进行挖掘主要是为了对于系统运行相关的信息进行跟踪检测,便于发现系统运行问题,从而做到对系统的有效检测和维护。就当前常用的挖掘方法来看,主要可分为基于规则和基于自动化两种。两种方法分别依据程序行为规则和API规则开展挖掘工作。
  3.数据挖掘技术在软件工程中的应用方法
  3.1关联方法
  挖掘技术应用与软件工程中的关联方法,其规则在于发现大量数据中所具有的相关联系及有趣关联。并且关联规则具有两个重要特征,其一为支持度,表示为 P(A ∪B),表明 A、 B 两个子集在事物集中出现的概率是相同的;其二为置信度,可表示为 P(B|A),说明 A 在事物集中所具有的概率,同样 B 也会出现[3]。
  3.2聚类方法
  聚类方式的应用,顾名思义,便是把对象数据分为多个簇或类,并且保证统一类或簇中的数据的相似度较高,同时不同类或簇中的对象具有明显的差别。
  3.3分类方法
  分类方式的应用,主要是对离散值和分类标号进行操作,一般情况下,首先需建立起相应的模型,对其概念集和数据类集进行描述,之后应用模型完成分类
  4.结语
  综上所述,数据挖掘技术是软件工程向更加完善、优化方向发展的必然之路,更是时代发展的要求。随着社会信息化程度的不断加深,数据挖掘技术的应用将会更加的广泛。研究人员对此项技术也要引起重视,通过不断的研究和探索,进一步的提升其自身的水平及其应用的价值,为人类的不断发展,社会的进步体现更大的价值。
  参考文献:
  [1]李明江,唐颖,周力军. 数据挖掘技术及应用[J]. 中国新通信,2012,22:66-67+74.
  [2]陳建桦. 数据挖掘技术在软件工程中的应用研究[J]. 硅谷,2014,01:73+51.
  [3]刘玉峰. 数据挖掘技术在软件知识库中的应用研究[D].广西师范大学,2010.
其他文献
[摘 要]通过能铸铁阀门补焊的实践,针对铸铁阀门的焊接困难,阐述了铸铁阀门的焊接方式和焊接工艺。  [关键词]手弧焊;铸铁;补焊  中图分类号:TG455 文献标识码:A 文章编号:1009-914X(2016)17-0247-01  前 言  在采油二厂生产一线,铸铁阀门使用的十分普通,阀门开关的顺利和阀门控制内漏的好坏直接关系到正常的油井生产,如果出现阀门开关不严或者本体破裂,将影响油井的生产
期刊
[摘 要]我国在各项科技技术不断发展的同时,也注意对10kV配电设计中节能措施的研究,从而有效降低供电成本,极大节省企业的运营支持,进而投入在科技研发方面的资金就增多。通过实践工作的总结分析,通过合理设置配电线路,选择 10kV线路的大截面导线,选择合适的变压器组别,使用无功补偿技术,以及使用架空绝缘导线等,就可以做到很好的节能目的。下面就对这些方面进行分析,希望给有关人士一些借鉴。  [关键词]
期刊
[摘 要]伴随着我国科学技术的飞速发展,我国地铁综合监控系统也取得了较大的进步,通过调查分析当前我国地铁综合监控的发展现状,我们可以依据集成模式把综合监控系统分为两种,一种是顶层信息集成模式,一种是深度系统集成模式。下面文章中主要阐述了地铁行车中综合监控的自动化技术及其应用。  [关键词]地铁 ;综合自动化监控 ;系统集成  中图分类号:TP277 文献标识码:A 文章编号:1009-914X(2
期刊
[摘 要]文化遗产作为我国文化强国中重要组成部分,其保护与管理总体发展水平得到了很大的提高。空间技术在文化遗产保护与管理中的不断尝试,尤其是遥感技术的在文化遗产中的不断发展与运用,对于现今文化遗产的科学保护起着非常重要的作用。  [关键词]遥感技术遗产保护遗产管理  中图分类号:TN958.98 文献标识码:A 文章编号:1009-914X(2016)17-0241-02  随着我国信息技术的快速
期刊
[摘 要]随着天津一汽骏派D60城市SUV的发布,天津一汽另一款三厢车正在研发。此三厢车前车门的部分研发过程即为本文的内容。利用CAE(计算机辅助分析)手段可以在前期设计阶段就给出性能合格的产品,并节省大量试制、实验的时间和金钱,并缩短研发周期。采用有限元分析在车门设计前期计算出车门各项刚度和强度指标,并优化车门不合格的指标,在试制实验之前,提供最终版车门模型。  [关键词]车门,刚度,强度优化 
期刊
[摘 要]强对流天气指的是发生突然、天气剧烈、破坏力极大,常伴有雷雨大风、冰雹、龙卷风、局部强降雨等强烈对流性灾害天气,常发生在对流云系或单体对流云块中,因此一直以来都是天气分析和预报中的重点。结合现实情况来说,很多预报人员并不清楚强对流天气的基本内涵,导致分析、预报的过程中造成概念、理论被滥用。本文以下针对这些问题进行研究,并从分析预报实践的角度提出解决措施。  [关键词]天气预报;强对流天气;
期刊
[摘 要]本文简述了常规游梁式抽油机下偏杠铃改造技术,论述了下偏杠铃游梁复合平衡节能技术结构组成、节电原理,通过改造改善了抽油机平衡状况,改善了受力状况,延长了设备使用寿命,降低了能耗,通过研究,制定了选井原则,通过在萨北开发区应用,取得了较好的效果。  [关键词]抽油机 下偏杠铃 节能技术  中图分类号:TE933.1 文献标识码:A 文章编号:1009-914X(2016)17-0265-01
期刊
[摘 要]起重机作为常见的物料搬运设备,在工业生产中有着不可替代的作用。所以提高桥式起重机的运行效率,确保运行的安全可靠性是十分重要的。加强对桥式起重机电气应急运行技术的进一步研究与开发,能够更好地解决桥式起重机因发生电气故障而无法正常有效工作的问题,从而确保了起重机的工作效率与质量。本文笔者简述了起重机电气应急系统的重要性,并在此基础上介绍了大小车应急系统及起升机构单动控制技术的设计原理和方案。
期刊
[摘 要]在参照现有的技术管理概念的基础上,结合煤矿企业自身的特点,提出和总结了矿井技术管理的定义,对反映其内容的数个指标依其对矿井安全绩效的大小用灰色关联分析做重要度排序,进而指出矿井技术管理的重点所在,该方法可供其它煤矿矿井管理做为参考。  [关键词]技术管理;本质安全;安全业绩;灰色关联度  中图分类号:TN 文献标识码:A 文章编号:1009-914X(2016)17-0258-02  1
期刊
[摘 要]在国家经济与科学技术快速发展的背景下,大型飞机数字化装配技术的应用十分广泛。在多数领域与学科中,飞机数字化装配技术被综合运用,并且予以深入研究,一定程度上推动了大型飞机数字化装配技术的突破性发展。文章针对目前大型飞机数字化装配技术的应用状况进行了阐述,对飞机数字化技术进行了深入地分析,提出了飞机数字化装配技术未来的发展前景。  [关键词]大型飞机;数字化装配技术;浅析  中图分类号:V2
期刊