【摘 要】
:
面对海量的存储数据,如何从中发现有价值的信息或知识,成为一项非常艰巨的任务。数据挖掘就是迎合这种要求而产生并迅速发展起来的。数据挖掘,又称为数据库中的知识发现,就是从数
论文部分内容阅读
面对海量的存储数据,如何从中发现有价值的信息或知识,成为一项非常艰巨的任务。数据挖掘就是迎合这种要求而产生并迅速发展起来的。数据挖掘,又称为数据库中的知识发现,就是从数据集合中发现隐含的、先前未知的、对决策有潜在价值的用户感兴趣的知识。关联规则是数据挖掘研究中的一个重要课题,关联规则为发现数据之间的潜在联系提供了一种有效的机制。关联规则通常具有如下形式:X()Y,其中X和Y都是项集。关联规则挖掘就是发现满足用户给定的最小支持度和最小可信度的关联规则。
本文就数据挖掘中的关联规则进行了一些研究 ,关联规则可以分为布尔型关联规则和多值关联规则。布尔型关联规则挖掘是在属性值为布尔量的关系表中发现属性值同时为“1”的属性之间的关系。目前提出的挖掘多值关联规则的算法大多是将多值属性关联规则挖掘问题转化为布尔型关联规则挖掘问题,即将多值属性的值划分为多个区间,每个区间算作一个属性。本文针对这一问题,提出多值属性下的项集子集的定义,给出多值属性下一种新的支持度的计算方法,对Apriori定理在数值区间下进行了扩充。对项集存在包含关系的两规则的可信度和支持度的大小关系进行深入的研究,提出并证明了后件子集定理和前件子集定理。这两个定理对区间合并和冗余规则的删除具有一定的指导性作用。最后,针对目前很多区间合并是一种局部最优化,本文提出一种基于规则的兴趣度最大化的全局划分区间的方法;利用模糊集理论解决了现有的多值关联规则挖掘方法中一种硬划分的缺陷,而且挖掘出来的模糊关联规则更容易让人们理解。因此,本文提出模糊关联规则的定义,可信度和支持度在模糊下的计算方法,并在此基础上提出了一种利用模糊C-均值聚类法把属性值划分为语言值的软方法。
其他文献
随着云计算技术的不断发展,虚拟资源管理已成为其中关键技术之一。为了提高资源利用率,获得更大的收益,云计算需要对资源进行有效的管理。通过对一些虚拟资源管理方法的研究
本文首先论述了有关业务模型、移动模型的研究背景、当前发展趋势和研究方向。然后对几种业务模型、移动模型进行建模、仿真。本文主要从两个角度研究业务模型、移动模型,重点
封装良好的功能构件、软件框架等软件构件使得开发人员无需了解构件的实现细节就可以通过接口访问的方式实现复用。软件构件包括离线和在线两种形态。传统的离线构件复用需要
实时准确地监测电站锅炉炉膛缩口部位结焦与否一直是颇受关注的实际问题。锅炉结焦的危害很大,可能会降低锅炉的输出功率,降低锅炉的热效率,甚至会造成事故,严重时会出现锅炉爆炸,影响机组安全经济运行。将数字图像处理与模式识别技术应用于锅炉炉膛结焦监测是一个十分可行的问题解决方案。 本文对电站锅炉结焦状态监测系统进行了研究与设计。该系统由图像处理和图像识别两大部分组成,图像处理部分是研究的重点。在准确
网管系统或被管设备如果要入网使用或者进行招标选型,必须要经过严格的一致性测试,从而验证其是否符合一定的网管规范,及其符合程度,才能决定是否使用。 本文通过将完成某一功
在过去的十年里,由于带全球定位系统的智能设备的普及与移动互联网络的迅速发展,基于位置的服务已经成为了人们生活中一种重要部分。导航与位置服务技术已成为互联网、移动通
随着互联网的飞速发展,网络多媒体应用得以推广和普及。但是,传统多媒体需要下载完成后才能播放的特点与现今网络带宽资源有限的情况发生矛盾,于是产生了可以一边下载一边观
有效地从复杂图像中准确表征和提取待识别目标的形状和轮廓在许多领域具有重要的应用,也是计算机进行目标智能识别和分析的重要基础技术。大量研究表明,由于目标特征的复杂性与
人体步态识别是人体视觉分析的一部分,是近年来计算机视觉领域中备受关注的前沿方向。步态作为一个独特的生物行为特征,与其它生物特征相比,具有易感知、非侵犯性、难于伪装等优
计算机支持的协同设计(ComputerSupportedCooperativeDesign,CSCD)作为计算机支持的协同工作(ComputerSupportedCooperativeWork,CSCW)的一个重要分支,已经吸引来自研究机构