论文部分内容阅读
摘 要:随着时代科技的不断进步,互联网信息技术已经渗透到社会中的各个层面。数据库的运用使得企业信息、国民生态、社会状态等方面都有了可靠的参考依据。目前数据库的功能都是存储、查询、统计等,通过这些数据获得的信息量只占整个数据库信息量的一小部分。怎样才能对数据库中真正具有价值的信息进行使用,從而提高有效信息的利用程度,这就需要新的技术来进行这方面的工作。数据挖掘技术从被开发以来便被广泛利用,它能够有效的实现对有价值信息的自动、智能和快速的分析与提出。数据挖掘技术在分析大量数据时具有明显优势,在电力、金融、保险等行业得到广泛的运用。
关键词:数据挖掘 应用范围 科学研究
中图分类号:TP311 文献标识码:A 文章编号:1672-3791(2017)08(c)-0021-02
21世纪被称为互联网时代,信息技术已经成为国民发展的重要组成部分。信息网络技术在各行各业都得到广泛的利用,有效提高的企业发展的经济水平与管理水平。但是,计划经济转向市场经济的速度逐渐加快,竞争也是逐渐激烈,这就导致各行业的信息系统积累了大量的数据信息,并且由于没有专业的信息技术对数据进行分类处理,使得信息数据愈加增多,造成存储混乱,使用不便。数据挖掘技术的出现使得这些问题得到了有效的解决。目前在我国的信息化管理、科学研究、电力企业、金融行业、医学医药业等方面,对数据挖掘技术的使用非常频繁。在大数据背景下的企业发展受到市场经济的阻碍,数据挖掘技术能有效的对大数据进行处理,并且实现自动化、智能化,加强海量数据的有效利用,进而促进互联网时代的发展。
1 数据挖掘技术的概述
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。岩石数据可以是结构化的,如广西数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的。也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。所以,数据挖掘是一门很广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。
2 数据挖掘的过程
数据挖掘的整个过程是需要对既有的数据进行挖掘计算并建立数据模型,以及围绕数据挖掘所进行的预处理和结果表达等一系列的步骤,这个过程需要反复进行,反复处理,保证数据结果的实用性。数据挖掘是知识发现的重要组成部分,其主要步骤为以下几点。
2.1 目标定义
数据挖掘需要确定明确的目标。挖掘目标的定义是需要具有数据挖掘经验的技术人员,以及在该领域具有权威的专家和最终用户之间相互配合、相互协作,目标定义是否适度对数据挖掘的成功概率有较大的影响。数据挖掘的目标定义既是对实际工作中对过程的要求,也是通过对各种学习算法的对比进而确定可用的算法。
2.2 数据准备
数据准备是数据挖掘的重要组成部分,所占比例基本都在一半以上。从数据的选择、预处理以及变化三个方面进行有序的准备。数据选择是从既有的数据信息库中提取有关数据,作为目标。数据预处理是队数据目标进行相应的处理,反复处理,直到数据目标符合数据挖掘的要求。数据变化的作用就是精减数据维数,也就是在进行数据挖掘前,对目标数据的特征进行处理筛选,选出具有价值的特征,以免在进行数据挖掘时进行不必要的特征分析以及考虑删减个数。
2.3 数据挖掘
这个阶段便是数据挖掘中的实际操作阶段。首先要确定采用哪种类型的方法进行数据挖掘,其次,是对开始选择的挖掘方法选取一种计算算法。最后,在保证上述的准备阶段不出现任何问题后,就能进行具体的数据挖掘,也就是运行数据挖掘算法模块。这个阶段才是数据挖掘的主要阶段,也是数据挖掘分析者和相关领域专家最为重视的阶段。
2.4 成果和评估
最终用户影响着提取信息的分析成果,所以要根据最终于用户的决策目的进行数据分析,并提取其中最具价值的信息。数据挖掘过程中的模式要在完成数据提取后进行机器或用户的评估,对去其中与数据挖掘无关的模式要进行删除,以免对下次运算形成干扰。有的模式是无法满足用户需求的,对于这种模式不能删除,而是要将其退回到上一阶段。本文所提出的最终用户基本就是以人为主体的单位,所以要对方向的模式进行可视化,或是把提取的数据信息运用其他用户易懂的模式展现出来。
3 数据挖掘的应用领域
数据挖掘技术对于目前的企业发展有着重要的作用,从以前的挖掘算法研究到如今的实际运用,都表明了数据挖掘技术的广泛性和实用性。目前在已知的领域中,基本都开发除了许多专业的数据挖掘工具,包括电力、金融、医学、天文、交通等方面的数据挖掘工具。
3.1 科学研究
科学研究需要时刻记录数据,并且需要大量的实际信息数据进行实验分析,一般的数据分析工具对于大数据计算速度缓慢且无法提取有价值的信息,所以数据挖掘技术就被应用进科学领域,并且起到了重要的作用。在天文图形分析、卫星遥感器和DNA分子技术等方面均取得了不错的成果。有了数据挖掘技术的支持,科学研究中的数据不再被压缩以及混乱堆放,有效提高了科研工作的效率。其中科学研究中应用数据挖掘技术的还有医药研究、生物研究、地质研究、考古研究、星体运作规律研究、化工研究等。
3.2 市场营销
市场营销作为企业发展的根本保障,几乎每天都要积累相当多的数据,而市场营销也是第一个应用数据挖掘技术的领域。数据挖掘技术在市场营销中的作用主要客户资源、客户市场、客户流失分析和客户稳定等。其中,在客户细分与流失模型等方面数据挖掘的应用较为成熟。在市场营销中还包括电力行业、保险行业、信用卡业等方面的应用,使得企业对客户的了解程度加深,能够有效判断客户的购买模式,从而针对有价值的客户进行长期合作。
3.3 医学医药
医学行业的制药方面可以采用数据挖掘技术针对分子制药到医疗诊断等方面提高效益。药物的合成需要对药物分子的化学结构有全面的了解,在药物分子分析的过程中确定药物中原子或原子基因所针对哪种病情具有治疗作用,可以作为之后的新药合成时的依据。
3.4 金融行业
金融行业的数据量可以用海量来形容,数据挖掘技术的应用有效改善了金融行业数据多却不能科学处理的现象。银行、证券公司等几乎每天都会产生非常大的数据,并且流量速度快,其中包括很多不确定的风险因素,可以利用数据挖掘技术对此进行深入分析,比较典型的就是股票的市场预测以及金融诈骗等。
本文只是列出了典型的几个数据挖掘技术应用的领域,当然数据挖掘技术的应用领域不止这些,随着社会的不断发展,数据挖掘技术也将会在各个领域发挥重要的作用。
4 结语
就目前已知的所有领域中,基本都有着数据挖掘技术的存在,这不但体现了数据挖掘技术的实用性,也体现了我国各行业的发展正在不断加快。数据挖掘技术的影响力越来越大,社会关注度也越来越高,相信随着时代科技的不断发展,对未知领域的不断探索,数据挖掘技术的应用范围必将更加广泛。
参考文献
[1] 苗宇.计算机数据挖掘技术的开发及其应用探究[J].城市建设理论研究:电子版,2016(22):155-156.
[2] 陈建伟,李丽坤.数据挖掘技术研究[J].数字技术与应用,2016(1):91.
关键词:数据挖掘 应用范围 科学研究
中图分类号:TP311 文献标识码:A 文章编号:1672-3791(2017)08(c)-0021-02
21世纪被称为互联网时代,信息技术已经成为国民发展的重要组成部分。信息网络技术在各行各业都得到广泛的利用,有效提高的企业发展的经济水平与管理水平。但是,计划经济转向市场经济的速度逐渐加快,竞争也是逐渐激烈,这就导致各行业的信息系统积累了大量的数据信息,并且由于没有专业的信息技术对数据进行分类处理,使得信息数据愈加增多,造成存储混乱,使用不便。数据挖掘技术的出现使得这些问题得到了有效的解决。目前在我国的信息化管理、科学研究、电力企业、金融行业、医学医药业等方面,对数据挖掘技术的使用非常频繁。在大数据背景下的企业发展受到市场经济的阻碍,数据挖掘技术能有效的对大数据进行处理,并且实现自动化、智能化,加强海量数据的有效利用,进而促进互联网时代的发展。
1 数据挖掘技术的概述
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。岩石数据可以是结构化的,如广西数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的。也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。所以,数据挖掘是一门很广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。
2 数据挖掘的过程
数据挖掘的整个过程是需要对既有的数据进行挖掘计算并建立数据模型,以及围绕数据挖掘所进行的预处理和结果表达等一系列的步骤,这个过程需要反复进行,反复处理,保证数据结果的实用性。数据挖掘是知识发现的重要组成部分,其主要步骤为以下几点。
2.1 目标定义
数据挖掘需要确定明确的目标。挖掘目标的定义是需要具有数据挖掘经验的技术人员,以及在该领域具有权威的专家和最终用户之间相互配合、相互协作,目标定义是否适度对数据挖掘的成功概率有较大的影响。数据挖掘的目标定义既是对实际工作中对过程的要求,也是通过对各种学习算法的对比进而确定可用的算法。
2.2 数据准备
数据准备是数据挖掘的重要组成部分,所占比例基本都在一半以上。从数据的选择、预处理以及变化三个方面进行有序的准备。数据选择是从既有的数据信息库中提取有关数据,作为目标。数据预处理是队数据目标进行相应的处理,反复处理,直到数据目标符合数据挖掘的要求。数据变化的作用就是精减数据维数,也就是在进行数据挖掘前,对目标数据的特征进行处理筛选,选出具有价值的特征,以免在进行数据挖掘时进行不必要的特征分析以及考虑删减个数。
2.3 数据挖掘
这个阶段便是数据挖掘中的实际操作阶段。首先要确定采用哪种类型的方法进行数据挖掘,其次,是对开始选择的挖掘方法选取一种计算算法。最后,在保证上述的准备阶段不出现任何问题后,就能进行具体的数据挖掘,也就是运行数据挖掘算法模块。这个阶段才是数据挖掘的主要阶段,也是数据挖掘分析者和相关领域专家最为重视的阶段。
2.4 成果和评估
最终用户影响着提取信息的分析成果,所以要根据最终于用户的决策目的进行数据分析,并提取其中最具价值的信息。数据挖掘过程中的模式要在完成数据提取后进行机器或用户的评估,对去其中与数据挖掘无关的模式要进行删除,以免对下次运算形成干扰。有的模式是无法满足用户需求的,对于这种模式不能删除,而是要将其退回到上一阶段。本文所提出的最终用户基本就是以人为主体的单位,所以要对方向的模式进行可视化,或是把提取的数据信息运用其他用户易懂的模式展现出来。
3 数据挖掘的应用领域
数据挖掘技术对于目前的企业发展有着重要的作用,从以前的挖掘算法研究到如今的实际运用,都表明了数据挖掘技术的广泛性和实用性。目前在已知的领域中,基本都开发除了许多专业的数据挖掘工具,包括电力、金融、医学、天文、交通等方面的数据挖掘工具。
3.1 科学研究
科学研究需要时刻记录数据,并且需要大量的实际信息数据进行实验分析,一般的数据分析工具对于大数据计算速度缓慢且无法提取有价值的信息,所以数据挖掘技术就被应用进科学领域,并且起到了重要的作用。在天文图形分析、卫星遥感器和DNA分子技术等方面均取得了不错的成果。有了数据挖掘技术的支持,科学研究中的数据不再被压缩以及混乱堆放,有效提高了科研工作的效率。其中科学研究中应用数据挖掘技术的还有医药研究、生物研究、地质研究、考古研究、星体运作规律研究、化工研究等。
3.2 市场营销
市场营销作为企业发展的根本保障,几乎每天都要积累相当多的数据,而市场营销也是第一个应用数据挖掘技术的领域。数据挖掘技术在市场营销中的作用主要客户资源、客户市场、客户流失分析和客户稳定等。其中,在客户细分与流失模型等方面数据挖掘的应用较为成熟。在市场营销中还包括电力行业、保险行业、信用卡业等方面的应用,使得企业对客户的了解程度加深,能够有效判断客户的购买模式,从而针对有价值的客户进行长期合作。
3.3 医学医药
医学行业的制药方面可以采用数据挖掘技术针对分子制药到医疗诊断等方面提高效益。药物的合成需要对药物分子的化学结构有全面的了解,在药物分子分析的过程中确定药物中原子或原子基因所针对哪种病情具有治疗作用,可以作为之后的新药合成时的依据。
3.4 金融行业
金融行业的数据量可以用海量来形容,数据挖掘技术的应用有效改善了金融行业数据多却不能科学处理的现象。银行、证券公司等几乎每天都会产生非常大的数据,并且流量速度快,其中包括很多不确定的风险因素,可以利用数据挖掘技术对此进行深入分析,比较典型的就是股票的市场预测以及金融诈骗等。
本文只是列出了典型的几个数据挖掘技术应用的领域,当然数据挖掘技术的应用领域不止这些,随着社会的不断发展,数据挖掘技术也将会在各个领域发挥重要的作用。
4 结语
就目前已知的所有领域中,基本都有着数据挖掘技术的存在,这不但体现了数据挖掘技术的实用性,也体现了我国各行业的发展正在不断加快。数据挖掘技术的影响力越来越大,社会关注度也越来越高,相信随着时代科技的不断发展,对未知领域的不断探索,数据挖掘技术的应用范围必将更加广泛。
参考文献
[1] 苗宇.计算机数据挖掘技术的开发及其应用探究[J].城市建设理论研究:电子版,2016(22):155-156.
[2] 陈建伟,李丽坤.数据挖掘技术研究[J].数字技术与应用,2016(1):91.