论文部分内容阅读
论文以聚酯工业产业链中的两个关键过程对二甲苯(Para-Xylene,简称PX)吸附分离、氧化过程为背景,以SVM方法为工具,从数据挖掘的角度分别对预言型数据挖掘和探索型数据挖掘在PX工业中的应用进行了研究。最后在提出算法的基础上实现了一个数据挖掘的软件平台ESP-PISDMS。论文主要的研究工作可以概括为如下几个方面, (1) 提出了一种改进的SVM分类算法。从测试样本是否满足KKT条件出发,分析新增样本和原有样本交互学习中支持向量集构成的变化,将尽可能多的可能包含支持向量的样本选入当前的工作训练集中,提高算法精度。通过合理地划分样本集的大小,和传统的算法相比该算法在处理大规模样本时具有较高的精度和训练速度,并且非常适用于在线增量学习。 (2) 提出了两种基于SVM的增量建模方法SVMIL和ISVM,随着时间推移,每次在模型中增加一批(一个)样本进行增量学习的同时,采用启发式策略去掉工作集中一批(一个)样本,这样可以在软测量建模中不断增加能够代表新工况信息样本的同时控制工作样本集的规模。将提出的软测量建模方法用于PX吸附分离过程PX纯度的预测中,并和其他方法作了比较。 (3) 提出了两种用于模糊SVM的模糊隶属度函数-基于κNN的隶属度函数和基于支持向量数据域描述(SVDD)的隶属度函数。前者在特征空间中根据样本与其最临近样本点的距离来确定其隶属度,后者首先得到训练集中样本的数据域描述模型,然后根据每个样本偏离数据域的程度赋予不同的隶属度。将提出的模糊隶属度函数模型及其建模方法用于工业PX氧化过程中4-CBA浓度预测的问题中,并和其他方法作了比较,提出的模型可以有效减少回归误差,提高SVM抗噪声的能力。 (4) 提出了一种基于SVM的超矩形规则提取算法HRE。在HRE算法中,数据样本先被映射到一个高维的特征空间中,用于得到样本的最优分类超平面以及支持向量,然后在一些启发式条件的限制下,在得到的支持向量和聚类中心的基础上构建超矩形规则。在HRE中控制规则的支持度以及数量非常容易,得到的规则具有更高的质量。