连续属性相关论文
基于粗糙集理论的模型筛选与组合预测方法对于舰船维修费用的预测具有较强的应用价值,然而在连续属性离散化方面却存在部分问题。针......
连续属性的离散化是数据挖掘理论中重要的研究内容之一,有监督离散化没有考虑属性之间的相容性,对最终的效果造成一定的偏差,无监......
由于计算机的迅速普及和互联网的广泛流行,产生了数据和信息的汪洋大海。要想从中获取隐藏、有用的知识,就要使用各种学习算法和方法......
数据挖掘是信息技术自然演化的结果,它是指从大量数据中挖掘出来隐含的未知的、有价值的模式或规律等知识的复杂过程。在这过程中,......
研究时间序列异常模式挖掘具有重要的学术价值和现实意义。针对时间序列连续、非线性、高维的复杂结构,探索了时间序列异常模式挖......
语义决策树算法虽然可以进行语义方面更加精确的匹配,但存在硬性划分的缺陷。在连续属性语义化的过程中,将训练集中的数据映射为语......
在连续数据的关联规则挖掘中,属性值的离散化是挖掘的一个重要环节。连续数据的最优离散化是一项挑战性研究。在关联规则挖掘过程......
连续属性离散化问题是数据挖掘重要的研究步骤之一.本文基于粗糙集的有关理论,提出了一种新的连续属性离散化方法.首先提出度量属......
粗糙集和支持向量机都是为了从数据中提取固定模式而提出的数据挖掘方法。粗糙集理论适用于海量数据,支持向量机是在统计学习理论......
粗糙集理论是上世纪八十年代初由波兰数学家Pawlak首先提出的一种新的处理不精确、不完全与不相容知识的数学理论。其主要思想是利......
摘要:决策表中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值。该文提出一种新的决策表连续属性......
关联分析是数据挖掘算法中的一种,主要用于发现数据集中变量或项之间的关联关系,被各个行业广泛应用。其中,离散变量尤其是二元变......
连续属性离散化问题是机器学习的重要方面,是数据预处理问题之一.提供的基于动态层次聚类的离散化算法是层次聚类算法的一种改进.......
针对新能源智能车监控数据中包含过多的连续属性,提出了一种基于分辨矩阵和信息增益率的有监督离散化算法,从而降低连续属性的取值......
将各连续属性上的取值划分威多个语言值,利用微粒群算法优化各语言值的正交隶属函数,提高关联规则的可理解性特征,在此基础上提出了语......
由于粗糙集只能对离散属性进行处理,因而连续属性的离散化也就成了粗糙集的主要问题之一。提出了一种从模糊聚类出发的离散化方法,......
为解决经典粗糙集理论在处理决策表离散化时规则数多、准确率低的问题,文中提出基于贪心算法和属性值分布率相结合的二次离散化方法......
为了利用信息系统对象在数据空间中分布,通过对对象的模糊聚类,计算每一类在坐标轴上的统计值。利用正态概率分布特性,引入重叠度......
通过将连续属性离散化和属性约简结合起来,首先对连续型的属性列进行离散化,得到新的决策表;然后再对新的决策表作属性约简,解决了......
根据模糊集原理,提出了一种数量型数据挖掘关联规则的方法,并通过试验证明了算法的合理性.......
决策树分类算法C4.5是数据挖掘中最常用、最经典的分类算法。但是C4.5算法也存在一些不足之处,针对C4.5算法处理连续属性比较耗时......
首先利用粗集理论和模糊聚类理论确定连续多变量属性的选择问题,然后利用聚类中心算法建立等级标准中心以解决连续变量的区间划分......
连续数值属性的离散化是粒计算理论应用的重要步骤,提出粒度商的连续属性离散化方法。通过给出粒度商的概念,根据粒度商的大小来选......
传统的粗糙集理论只能处理离散属性,所以在对决策表进行处理之前,必须对决策表中的连续属性进行离散化。提出一种新的相容离散化算......
连续属性的离散化是粗糙集理论研究的一个重要内容,对后继阶段的知识获取过程具有重要的意义。选取用于离散化的断点一般分为两步,即......
商业智能分析诸多算法是基于离散化数据的,但商业分析的中数据类型不一,将连续属性离散化是商业智能分析中数据预处理中非常重要的......
如何有效地从具有连续属性的数据中挖掘关联规则,是目前数据挖掘领域的一个研究热点。基于遗传算法,提出了一个连续属性关联规则挖掘......
连续属性信息系统的规则约简根本问题是属性在连续范围取任何实值,使得应用与离散属性的规则约简方法难于使用。因此解决连续属性信......
以提高连续属性数据流的分类挖掘效率为目标,设计并实现了一种基于红黑树的连续属性数据流快速决策树分类算法VFDT_RBT。该算法利......
一、前言伴随着Intemet的普及,电子邮件作为一个主流的通讯载体日益得到更多的使用.但是随之而来的垃圾邮件也越来越猖獗.中国互联......
连续属性的离散化在数据挖掘中有着非常重要的作用。本文基于可辨识矩阵提出一种连续属性离散化的方法,并利用平均互信息量对离散化......
针对信息系统为连续属性的情况,提出一种将粗糙集与模糊集相结合来获取决策规则的方法.这种基于粗糙-模糊集集成模型求取决策规则......
机器学习中很多方法要求目标属性是离散的,而实际中很多属性是连续的。目前的连续属性量化算法存在的问题是当新的对象加入决策表时......
决策树是分类数据挖掘的重要方法。其中,经典ID3算法根据具有最大信息增益的属性对训练样本集进行分类,适用于离散型属性。C4.5算法延......
随着知识发现和数据挖掘的迅速发展,出现了很多的数据挖掘方法,这些方法很多都依赖于离散的数据,连续属性的离散化是数据分析预处......
数据流挖掘分类技术是数据挖掘领域非常具有挑战性的工作。VFDT利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精......
针对朴素贝叶斯分类器不能有效利用属性之间依赖信息的问题,在将连续属性条件互信息计算、条件密度计算与通过建立类约束属性最大......
以便分析主要批评工程因素,作为信息的大小认为有条件的信息是熵的一条基于信息的不平的集合途径被开发了。为连续属性 discretizat......
连续属性的离散化问题是粗糙集理论研究的一个重要内容,通过对一种局部离散化方法的改进,提出了全局的离散化算法.利用粗糙集理论,......
数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域研究工作带来了新挑战,而其中分类算法更是当前......
该文提出了一种新的决策表连续属性离散化算法.首先使用条件信息量来度量条件属性的重要性,并据此对条件属性按照条件信息量从大到小......
为了减少连续属性离散化后有用信息的丢失和信息系统总的断点数量,提出了一种具有全局聚类效果的多属性离散化算法.算法根据各属性......
具有连续属性的分类问题普遍存在,目前主要采用两种方法来处理连续属性:一种是将连续属性进行离散化;另一种是基于高斯函数或高斯核......
为了提高基于大规模数据的决策树训练效率,提出了一种基于Spark平台的并行决策树算法(SPDT).首先,采用数据按列分区的方法,把单个......
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算......
分析了针对连续属性样本进行数据挖掘的缺陷,提出一种直接对连续属性样本进行分类规则挖掘的算法.它基于样本属性值分割点对实例样......
简要介绍了粗糙集连续属性的一种量化算法一基于VDM(Value Difference Metric)度量的划分法,并用该算法对实验数据为取自UCI机器学习数据库中心的数据集Iris进行量化......