基于区间数的不确定性数据挖掘及其应用研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:pipipipi9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尽管数据挖掘技术已经成功应用到很多领域,但是由于测量手段的局限性以及客观对象本身不确定性等原因,在自然和社会科学领域中存在大量待挖掘的数据是不准确、不确定的。如果不充分考虑这些数据的不确定性,不采用合适的数据挖掘方法,那么必然会导致挖掘模型性能下降,甚至是不可接受的。如何从大量不确定性数据中找出隐藏的知识,仍然是人们研究的主要课题。根据待挖掘数据所依据的不确定理论,不确定性数据挖掘方法可分为4种类型:随机数据挖掘、灰色数据挖掘、模糊数据挖掘和区间数数据挖掘方法。本文以国家863项目钢铁生产过程的质量控制为研究背景,为解决生产过程数据不完整、不确定、大数据量的数据挖掘困难问题,提出基于SVM以及核方法的区间数数据挖掘建模方法,并用于钢铁生产过程的质量预测和质量分析。本文主要工作包括以下几个方面:1.提出了两种区间数回归建模方法。针对钢铁工业过程中的实际需要,本文提出两种区间数回归建模方法:(1)基于SVM的区间数输入、区间数输出回归建模方法。该方法把SVM从实数回归分析推广到区间数回归分析,同时继承了SVM的优点;(2)基于SVM的精确数输入、区间数输出的回归分析建模方法。该方法对区间数上下界逼近回归建模的同时还考虑了上下界之间的相互信息。本算法能通过解凸二次最优化问题得到全局最优解,有效地避免了回归模型的上界小于下界的问题。2.提出了基于多尺度径向基小波SVM的精确数输入、区间数输出的鲁棒回归分析建模方法。首先提出并使用基于多尺度径向基小波SVM方法对带有离群点的多尺度区间数样本数据集进行训练,分别得到区间数上下界初始回归模型,初始回归模型不仅能够有效地逼近多尺度样本信号、具有较好的鲁棒性和推广性能,而且在正常样本点处残差较小,在离群点处残差较大;然后以加权M—估计函数作为代价函数,并使用梯度下降法同时调整区间数上下界回归模型参数,且根据间数上下界模型输出关系改变加权系数,消除了离群点对区间数回归模型的影响,解决了区间数模型输出上界小于下界的问题。3.提出了基于SVM的区间数分类建模方法。根据区间数的比较定义,该方法把区间数线性分类器转化为精确数输入的线性分类器,从而能够建立基于SVM的区间数分类器模型。本文通过设计合适的核函数,把区间数数据样本映射到高维特征空间,然后在高维空间中对样本数据进行线性分类,顺利地解决了区间数样本线性不可分问题,克服了现有的区间数分类算法对输入维数敏感以及不适合大量数据样本等问题。4.提出一种基于核方法的区间数模糊聚类算法。本文通过设计合适的核函数,有效地扩大样本模式之间的差异性,提高聚类算法对非对称数据以及混合数据模式的适应能力,且避免了直接在高维特征空间求解聚类问题。采用区间数遗传算法来求解非凸聚类优化问题得到聚类问题的全局最优解,大大提高了聚类质量。该方法解决了现有区间数聚类算法对多种聚类模式以及不对称数据聚类性能不理想的问题。5.以钢铁生产过程为应用背景,阐述了基于区间数的不确定性数据挖掘在实际生产中的应用,并与其它方法相对比。结果表明,本文提出的数据挖掘方法能够克服现有算法的缺点,并在钢铁过程的数据挖掘中取得较好的效果。
其他文献
结合山东某氧化铝厂在使用澳洲矿进行拜耳法生产中种分槽内过快结疤导致沉槽的状况,对槽内结疤的成分和表面形貌进行分析,确定种分槽内结疤以单斜晶系的α-Al(OH)3为主。分析
<正> “数宝”是武汉市湘益算具研究所根据儿童生理和心理特征,精心研制的一种袖珍算盘。珠形及其尺寸大小,便于儿童小手实地操作。“数宝”槽档半珠,有巧妙弹力装置,既可平
对山东商业职业技术学院2015级 1016名大学生吸烟情况及影响因素进行调查发现, 学生的整体吸 烟率约为11% ,处于较低水平, 超过 50%的吸烟学生正在或已经开始戒烟, 绝大多数
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
尽管指纹识别的研究和开发已取得重要进展,但是指纹识别的应用在目前并没有获得普及,这是因为指纹识别在识别准确性和识别速度方面还远远不能满足很多实际应用的要求。进一步提
历代关于《九歌》的图绘创作,不仅体现了处于不同时期的各个画家对九歌的多样解读,同时也展现出了画家们的精湛的技艺和风格。作为姑熟画派创始人的萧云从画师,其《九歌图》基于
为实现高校应用型本科试点专业培养应用型、职业型人才这一建设目标,本文提出把“双证融通”的教学模式应用在焊接教学中,论证“双证融通”教学模式在应用型本科焊接专业试点
中国真正数位位制的建立应该是等级社会制度建立以后出现的。从商代甲骨文中已经清楚的看到个、十、百、千、万的位制。
本文在分析农村水利工程管理现状的基础上,提出了相应的改进措施,包括强化人力资源管理、提高农民的参与性、建立更全面系统的水利管理机制、加大资金投入。
由于地域环境、家庭教育、教学资源等因素的影响,山区偏远学校的作文教学一直制约着山区语文教学质量的提高。本文结合海东市山区学校作文教学中存在的问题谈一点浅薄的看法。