数据挖掘算法研究及其在旅游业中的应用

来源 :青岛大学 | 被引量 : 0次 | 上传用户:WSZYC
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种高效、深层次的数据分析处理技术,数据挖掘目的是从大型数据库或数据仓库中提取隐含的、未知的、非平凡的以及有潜在应用价值的信息或模式,这些信息将为人们进行各种决策分析提供有力依据。序列模式挖掘是数据挖掘技术的一个重要的研究方向,其作用是挖掘相对时间或其他模式出现频率高的模式。分类分析是数据挖掘技术研究的又一个重要方向,常用的分类模型有决策树,神经网络,遗传算法,粗糙集模型,统计模型等。当前数据挖掘已用于电信、金融、商业、气象预报、DNA序列分析、股票发展趋势分析、入侵检测等许多领域,而且正在探索更多行业中的应用。 本课题主要研究了数据挖掘中的数据预处理、序列模式挖掘和决策树分类分析,详细介绍如下: 第一,指出了课题的研究背景及其重要的研究意义;从数据挖掘的理论研究和应用研究方面,对当前数据挖掘的国内与国外的研究动态进行分析,并就当前数据挖掘研究重点问题作了详细介绍。 第二,深入研究了数据挖掘中序列模式分析技术。回顾了序列模式分析的研究动态,详细介绍了当前序列模式分析的主要算法,分析比较了算法的优缺点,给出了算法中存在的问题。 第三,详细深入的介绍了分类分析的基本概念和处理过程,给出了模型评价标准,并详细分析了基于决策树的分类模型的研究动态,介绍了决策树分类分析的原理及步骤,并对ID3算法进行了深入的研究分析。 第四,针对ID3算法中存在的问题,对其进行了改进,提出了ID3_new算法,有效地缩减了ID3算法处理过程中的数据量,使生成的决策树更加简洁、有效,并且通过在产生决策树的节点时,同时记录下满足从该节点到根节点的路径的条件的记录数,从而提高决策树的决策能力。并通过实际应用证明了算法的有效性。 第五,构建了旅游消费者数据分析系统。首先说明了研究旅游消费者数据的重要意义;介绍了系统的主要功能:数据预处理、旅游消费者出行路线分析以及消费者消费能力分析;详细分析了数据预处理模块所采用的预处理手段和方法,对旅游消费者出行路线分析以及消费者消费能力分析中采用的算法进行了详细的描述,并利用该系统对山东省旅游消费者数据进行分析,并对结果进行了评价。 最后,对研究工作出现的问题进行了讨论并对三年的研究工作进行了总结,指明了今后进一步研究的课题。
其他文献
智能虚拟环境的研究内容是在虚拟环境中加入有生命的对象—即虚拟主体,通过对他们活动的模拟来进一步增强虚拟环境的真实感和沉浸感,以更逼真地模拟真实世界。在计算机图形学中
随着网络的普及和黑客们的增多,网络安全问题变得日益重要。作为防火墙的重要补充,入侵检测技术成为当前网络安全研究领域的热点。传统的基于异常的或基于误用的入侵检测总是
信息时代的今天,信息化建设已成为企业发展的必经之路。对中小企业而言,信息管理系统的构建作为企业信息化进程中必不可少的环节,传统的管理系统开发方法并不能满足中小企业低成
时间作为自然界普遍存在的一种属性,必然要在计算机中实现时间的思想,因此研究时态是计算机研究的一个重要方向,该文旨在知识库中来研究和实现时间的思想,能够处理时间的知识
目前,分布式应用已逐渐成为计算机行业发展的新趋势,而面向对象技术则已经是软件行业的主流,CORBA作为一种将二者结合起来的技术已引起了人们的广泛关注,对CORBA的研究也由对规范
论文简要概述了企业信息化建设的重要性,在分析韩城矿务局运销业务的现状及问题的基础上,针对煤炭行业信息化建设的必要性和紧迫性,详细分析了煤炭运销业务的特点。结合韩城矿务
建立、维护和发布具有高度可靠性和可用性的面向消费者的企业网站不但需要较高的技术,而且需要一个可操作性的程序.本论文讨论的是能支持在线销售和管理系统的计算机应用程序
学位
随着网络的迅猛发展、网络安全问题的日益突出、黑客入侵活动日益猖獗,越来越多的系统遭到了入侵的威胁。以计算机为核心的信息安全是涉及社会、政治、经济、军事等领域的重要
随着变电设备状态检修辅助分析系统的运行,系统中积累了大量宝贵的历史数据,为了充分利用这些数据,应建立数据仓库,以满足人们的决策分析需要。本文着重讨论了数据仓库的设计与实现。 在对数据仓库技术的深入研究的基础上,我们设计并实现了一个变电设备状态检修数据仓库系统。系统采用操作数据库一操作数据存储(ODS)—数据仓库(DW)三层体系结构。 操作数据存储ODS(Operational Data