面向属性归纳的数据概化方法的应用研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:panjintao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大型数据库或数据仓库中挖掘隐含的、未知的、非平凡的及有潜在应用价值的信息或模式的过程。数据挖掘获得的规则包括描述型规则和预测型规则,特征化规则是一种典型的描述性规则,数据概化是描述型规则挖掘方法的一种主要手段,而面向属性的归纳方法则是实现数据概化及生成特征化规则的一种重要方法。 概念层次使给定的数据离散化,收集并用较高层次的概念来替换较低层次的的概念,使数据进行归纳;通过概化使数据更有意义、更容易解释。对于同一个属性可以定义多个概念层次,以适应不同的用户需求。 本文对基于概念的面向属性归纳的方法进行了深入研究,分析了概念层次的定义、表示方法及评价标准等问题,设计了数据概化和特征化规则挖掘的算法和实现策略,给出了数据概化和特征化规则挖掘的结构框架。在此基础上,分析了现实工作中对于数据概化和特征化规则挖掘技术的需求,阐述了对于各种明细数据进行概化并获取特征化规则的意义,并以农业生产数据为例,对该数据库进行了统计分析,应用面向属性归纳方法实现了数据概化,获得了特征化规则,为农业生产决策提供辅助的决策支持。
其他文献
随着现代企业制度的建立以及社会经济的高速发展,企业人力资源已成为左右企业生存发展的重要因素,加强人力资源的有效管理和运作已成为企业提高竞争力的重要手段。 作者在研究国内外人力资源管理系统发展和Web技术的基础上,提出了一个实用的人力资源管理系统结构以及绩效考核算法,采用Delphi 7开发了基于Web的人力资源管理系统(HRMS)。系统包括九个模块:人事信息管理、考勤管理、培训管理、休假管理
智能交通系统(ITS)已经成为21世纪交通运输体系的发展趋势,其实质是对交通信息的分析、共享和综合利用。数据挖掘,简单地说,就是从大量数据中提取或“挖掘”知识。分类分析是数
本文在深入研究垃圾邮件的特点及其产生的根源、现有反垃圾邮件技术的优劣、中文分词技术、文本分类技术的基础上,将目前最优秀的中文分词技术与贝叶斯方法相结合,提出了针对中
随着攻击手段的复杂化和多样化,传统的入侵检测方法己不能满足安全需求,智能入侵检测已逐渐成为入侵检测乃至整个网络安全领域的研究重点之一。本文采用神经网络模型来实现系
随着网络技术的快速发展,依托网络,发挥网络信息资源丰富和不受时空限制的优势,实现网络教学,已经日趋普及。但是,由于学员个性千差万别,若使用划一的、模式化的教学形式,将
P2P(peer-to-peer)是一种新兴的互联网应用技术,因其自身的可扩展性、容错性、自组织性、高效性、低成本性,而受到越来越多的关注。目前在大多数的P2P系统上的信息检索(informa
近些年来,随着计算机视觉相关技术与理论的不断完善与发展,其在视觉检测、视觉导航与自动化装配领域中正被广泛地应用。在视觉系统中,通常摄像机因其价格低廉、获取信息丰富
长事务处理的框架级实现在整个企业级软件应用领域一直是人们研究的热门课题。其概念是指通过容器控制技术在分布式系统的整个软件范围内实现全局数据的一致性。在过去的几年
本学位论文研究了基于人工神经网络的手写体朝鲜文字脱机识别方法.朝鲜文字系统的文字数量庞大、相似文字多、手写体文字形变复杂、兼具西文单词和汉字的特点,同时又具有自身
WCDMA核心网从R4版本开始引入了软交换技术,在R99版本的基础上对电路域进行了彻底地改造。R4网络将控制面与承载面分离,使原来的交换机概念从逻辑上划分成MGW和MSC服务器。其