数据挖掘技术及应用

来源 :山西财经大学 | 被引量 : 0次 | 上传用户:nnnnnnnxxxxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要由以下四个部分组成:第一章,数据挖掘简介.从数据挖掘的概念、功能、目的、主要方法以及数据挖掘步骤,发现统计学与数据挖掘有着密切的关系:统计学和数据挖掘有着共同的目标即发现数据中的结构,但数据挖掘并不是统计学的分支,因为数据挖掘还应用了其它领域的思想、工具和方法,尤其是计算机学科.数据挖掘的出现为统计学提供了一个崭新的应用领域,虽然统计学不可能给出数据挖掘所有问题的答案,但它可以为数据挖掘提供非常有参考价值的框架,能够极大地丰富数据挖掘的方法.第二章,数据预处理及数据库的压缩.数据的清理有三种方法:空缺值的填充、异常点分析以及不一致数据的处理.数据库的压缩方法有很多,在介绍了主成份分析、信息增益分析技术和属性相关分析等进行维归约之后,引入了粗糙集理论.粗糙集理论既可以用于压缩数据库,又可以对属性的重要性程度进行测量及排序.第三章,数据挖掘的常用技术.数据挖掘技术可分为描述型数据挖掘和预测型数据挖掘两种,描述型数据挖掘包括数据总结、聚类及关联分析等.预测型数据挖掘包括分类、回归及时间序列分析等.这里主要介绍了常用的技术:决策树和决策规则、关联规则和聚类分析.第四章,数据挖掘技术的应用.该文的应用案例有两个,数据挖掘在移动通信中的应用以及对一份调查问卷的分析.针对移动通信客户众多,信息量大的特点,需要对手机用户消费水平的数据库进行压缩,对压缩后的新数据库可以运用决策树进行分类和关联规则以期找出几项费用与缴费总额之间的联系.而在"大学生素质培养的调查问卷"案例中,首先将24个影响一个人成长和发展的因素运用聚类分析进行了分类,然后运用以秩效应为标准进行属性项的排序的方法,对24个影响因素的重要性程度进行排序.最后对论文进行了总结,同时提出了未来在数据库的建立、数据的收集处理及预测等需要继续研究的几个问题.
其他文献
金融机构面临的风险是多种多样的,管理方法也非常多,市场风险和信用风险很早就引起了证券经营机构的重视,到目前为止都已经有了较为成熟和先进的管理技术,而操作风险长期以来
期刊
随着人们生活水平的提高,装饰行业发展迅猛,同时也带来各种隐患,由此导致污染伤害事件频频发生,白血病.肺癌,婴儿畸形等等,许许多多的惨痛案例告诫我们,室内污染已严重威协到
期刊
研究一种简单可靠的流动注射分析仪性能测试方法,阐述了流动注射分析仪测试用标准物质的选择,测试原理及具体的测试方法、步骤和测试结果的处理方法.该测试方法可操作性强,且
1994年分税制财政体制改革以来,中国形成了中央税和地方税体系.地方税收入随着我国经济持续高速度增长而增长,但近几年地方税收入增长速度有所下降,各地增收任务艰巨.对地方
党的十八大以来,习总书记充分强调了保护生态环境的重要性,但是不可否认的是现在的环境问题日益严峻,公众环境保护的力量已经不能有效的解决问题了,更多需要的是国家的力量,
期刊
金融系统的合理性发展能够有效促进经济的快速、健康增长,而金融系统的合理性很大程度上是指现有的金融结构是否合理,因此,金融结构的合理性在决定经济增长方面起着至关重要的作
比较分析了钢筋保护层厚度测量仪、楼板厚度测量仪工作原理,并就钢筋保护层厚度测量仪的定义、最大允许误差以及楼板厚度测量仪示值误差不确定度分析等进行了探讨.