【摘 要】
:
数据挖掘技术在近几年是很流行的计算机信息处理技术,通过这种技术在大规模数据中进行知识提取取得了很好的效果。数据挖掘技术已经被广泛的应用,对所应用到的行业通常起到指
论文部分内容阅读
数据挖掘技术在近几年是很流行的计算机信息处理技术,通过这种技术在大规模数据中进行知识提取取得了很好的效果。数据挖掘技术已经被广泛的应用,对所应用到的行业通常起到指导和决策作用。数据挖掘的方法很多,通过不同的方法可以解决不同数据所要解决的问题,也可以得到不同的知识形式。运用决策树分类对大规模数据进行挖掘是当前流行的方法,高效和精确是决策树技术显著的特点。通过决策树很容易进行规则的提取,并且转化成知识。人口数据对于一个国家来讲是至关重要的,因为人口是国家的最核心组成。人口数据随着信息技术和数据库技术的发展逐渐健全并且庞大,如何更好的运用人口数据服务国家和地区政策的制定,最终服务于社会和人口,已经是现代社会迫在眉睫的事情。本文主要研究如何运用数据挖掘的决策树分类技术对内蒙古自治区人口数据进行知识发现,主要关注的是通过分类技术发现人口属性之间潜在的联系。文中对数据挖掘和决策理论进行了比较深入的介绍。在实际应用中选取了内蒙古自治区某一个地区的人口作为研究对象,运用预处理技术对数据进行了归约、集成和简化,从而符合数据挖掘的数据要求。接下来选择基于信息增益和基于信息增益率中优秀的决策树算法生成决策树。然后根据内蒙古自治区人口数据的特点对生成的决策树进行优化,提高数据挖掘的准确性。接下来采用悲观错误率剪枝对优化后的决策树进行规模的控制,从而方便知识的提取。最后,使用“IF-THEN”规则进行了规则的提取,被提取规则存入知识库,用户可以通过图形化界面获取所需的知识,文中根据人口学理论也对所提取的知识进行了简要的分析,得出所需人口属性间关联原因。从研究内容可以发现,大规模数据通过简单的查询统计无法获得数据深层次的知识,庞大的数据只会被白白的浪费,借助数据挖掘的理论综合各种数据挖掘的方法对数据进行深入的分析,就可以得到数之间潜在的知识,当然数据挖掘也不是放任不管的进行挖掘,根据用户的需求和数据的特点需要灵活的使用算法,使得到知识更加准确和丰富。
其他文献
黑河流域水资源数据量庞大,数据关系复杂,应用常规技术进行优化调度难度较大。本文针对黑河流域当前存在的水资源调度问题,应用大数据处理与进化计算技术,基于大数据计算框架
随着互联网技术的飞速发展,电子文本信息迅速膨胀,呈现出海量性和杂乱性的特点,对这些海量文本信息的有效组织和管理已成为当前信息技术领域面临的一大挑战。基于人工智能的文本
非真实感绘制技术作为与真实感图形学相对应的图形学分支,从20世纪90年代开始受到关注并成为计算机图形学的一个研究热点。目前,非真实感绘制的研究成果已在计算机动画、计算机
随着无线传感器网络应用领域的扩展,低能耗路由协议的研究受到了广大学者的关注。无线传感器网络的微传感节点具有数目庞大、低成本、小体积以及应用环境的特殊性,同时其自身携
随着互联网迅速的兴起,网络广告也进入迅速兴起的时代。对于提供广告位的网站来说,如何更合理的以收益为目标来衡量广告位的价格,成为网站运营的一个重要环节。聚乐网系统这样一
输电线路是电力电网的重要组成部分,国内外许多的电力事故都是由输电线路故障引发的。对于运行中的输电线路,因表面污秽而引起的闪络是电网安全运行的主要威胁。因此,对电力绝缘子运行状态的实时监测是防止污闪的重要手段。绝缘子泄漏电流是表征绝缘子实时运行状态的重要数据,但其高频特性使得采集的数据量非常大,给数据通信和存储造成了严重的负担,数据压缩能够有效减小数据量,降低传输带宽要求。为了解决无线传感网络的输电
云计算是一种新型的计算模式,可通过互联网以服务的方式提供动态可伸缩的虚拟化的计算资源。云平台的应用迁移是将企业或组织的信息系统应用程序与数据从企业内部或专属服务
图像处理技术是利用计算机、摄像机及其它数字处理技术对图像施加某种运算和处理,以提取图像中的各种信息,从而达到某种特定目的的技术。它具有再现性好、精度高、适用面宽等特
视频监控系统在军事、经济以及社会安全方面扮演着重要的角色。传统的视频监控主要依靠人工完成,其效率很低而且容易造成监控的疏漏,近年来随着计算机视觉以及模式识别技术的
设计原理是产品为什么要这样设计的解释和记录,是最重要的一类设计知识。设计原理的捕获和重用对设计推理、设计评价、后续的产品设计和维护能起到非常重要的作用。然而,由于现有的设计原理捕获方法和系统在智能性等方面还很欠缺,使用时对设计进程的干扰较大,因此还难以达到工业界的实用要求。为此,本文研究具有智能性和多模式展示功能的设计原理捕获方法和系统,通过提高设计原理捕获的智能性和展示灵活性等,使其能够更好地满