基于类-属性关联的离散化算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jettey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离散化是数据预处理的重要方面,是数据挖掘的关键技术之一。在离散化算法的分类中,基于类-属性关联的离散化算法是当前离散化效果较好的方式之一。基于类-属性关联的离散化算法在运行效率和对离散后数据的预测精度上都有着较好的表现。不过在离散化过程中评估区间的分割条件时,往往会存在两个缺陷:一是对区间中少数类别考虑不充分;二是离散过程中产生的区间数不合理。针对上述问题,本文分析了CAIM算法与ur_CAIM算法的特性以及存在的缺陷,基于已有的类-属性关联的离散化算法的特性提出了两种新理论:一是通过粗糙集理论中属性重要性的确认方式与CAIM算法相结合提出新的连续属性权重的计算方式;二是根据ur_CAIM算法的特征提出了最小标准值的概念,并在最小标准值中引入了一个可变的标准参数e。最后基于新提出的连续属性权重的计算方式与最小标准值相结合对ur_CAIM算法的停止标准进行了改进,得到了新的离散化算法。改进后的算法在离散化过程中会充分考虑区间中各个数量类别的同时,可以产生更加合理的区间数,从而得到更合理的离散化方案。通过实验结果可以验证,本文提出的改进算法可以得到更合理的平均区间数,并且相对于其他离散化算法在使用分类器进行分类后的预测精度上也有更好的表现。之后将本文改进的算法应用在红酒品质检测中,证明了本文改进算法的实际可用性。虽然改进后的算法可以得到更合理的离散化方案,不过文中的标准参数e的取值是通过经验得到,因此如何根据数据集的特点来确定标准参数e的取值是未来可以继续研究的方向。
其他文献
随着我国氧化铝工业的蓬勃发展,我国自有铝土矿品位连年下降,目前北方铝土矿的平均铝硅比已骤降至4.5以下。对于我国这种普遍存在的高铝、高硅、低铁的低品位铝土矿,将很难使用经济的拜耳法处理;同时由于矿物结晶细散、组成复杂,往往又很难利用物理脱硅的方法提高其矿石品位。针对这一问题,本文以典型的低品位富高岭石型一水硬铝石矿为研究对象,利用氢氧化钠溶液在特定条件下只与高岭石选择性反应的特点,并保证抑制溶液中
大截面异种金属的焊接是异种金属焊接的重要课题。本文采用温度为950~1000℃,压强为20~25 MPa,真空度为0.6 Pa,保温时间为30~45 min的扩散焊工艺实现了直径为350 mm的45钢钢锭与304不锈钢钢锭的焊接。采用OM及SEM分析了焊缝及附近区域的微观组织及成分扩散,采用拉伸、弯曲、冲击、硬度和疲劳等试验对焊接接头的力学性能进行了研究。研究表明:(1)45钢与304不锈钢在界面
微尺度电火花线切割加工技术作为一种高精度、高效率的加工手段,由于其非接触式加工特点,加工过程无宏观作用力,不受材料本身硬度、强度等物理属性的限制,已逐渐成为解决难加工材料及微尺度结构精密加工难题的有效方法之一。本课题通过在五轴联动的低速走丝电火花线切割机床上搭建出旋转机构系统,从而实现了六轴联动的电火花线切割非完全贯穿曲面或局部具有微回转结构的零部件加工,并针对电火花线切割加工微回转结构进行基础工
《普通高中化学课程标准(2017年版)》明确了化学学科核心素养的内涵,其中,“宏观辨识与微观探析”是化学学科核心素养的五个维度之一,如何在中学化学教学过程中发展学生宏观辨识与微观探析核心素养已成为当前研究的热点。以发展核心素养为导向,研究高中化学教学过程中的教学设计具有现实意义。本文首先采用文献分析法,分析本课题的研究背景和研究意义,对国内外的研究现状进行梳理,研究了宏观辨识与微观探析等基本概念的
连续退火技术发展的关键问题就是冷却技术的发展。目前,国内外主流的带钢冷却技术都存在一些缺点。本文提出以戊烷为冷却介质的无氧化快速冷却技术,该技术以戊烷相变吸热为原理冷却带钢。针对该技术,本文设计并搭建了封闭式戊烷喷雾相变冷却实验平台;在该实验平台上对不同参数条件下的戊烷的冷却速率进行了实验研究;对该实验平台选用的喷嘴的喷雾均匀性进行了研究;对该技术今后应用到工业化大生产中的整个冷却循环系统进行了初
数控机床正向着高速高精的方向发展,滚动直线导轨作为导向部件得到了越来越广泛的应用。导轨的导向精度对机床的加工精度起关键性作用,导轨的力学特性、热特性以及热力耦合特性等非线性因素对导轨的最终精度有十分重要的影响,所以研究热力耦合特性对导轨精度的影响十分有意义。本文以THK公司生产的HSR系列滚动直线导轨为研究对象,研究了导轨热力耦合特性的形成机理,建立了导轨热力耦合特性的理论分析模型和仿真分析模型,
位姿估计技术在自动化机器人领域具有重要作用,而基于视觉惯导融合的位姿估计技术由于其硬件成本低廉以及传感器之间的互补特性成为当前位姿估计技术发展的重要趋势。在过去几年,大多数的视觉惯导融合方案都是基于滤波器方法,例如EKF、UKF、IEKF等。基于滤波器的方法可以分为两种融合策略,即松耦合和紧耦合。松耦合方法使用纯视觉位姿估计算法和惯性测量单元(Inertial measurement unit,I
随着航空航天、军工以及现代医学技术的发展,对零件的表面质量、尺寸精度要求越来越高,传统的铣削加工方式难以满足加工要求。为适应对难加工材料的加工要求,相关从业人员从刀具材料、刀具参数、加工工艺等方面进行了大量的基础研究。大量研究表明,在超声振动的辅助作用下,被加工表面质量及尺寸精度得到明显改善。本课题在TH5650型立式铣镗加工中心上搭建径向超声振动辅助铣削实验平台,并从径向超声振动辅助铣削理论研究
随着科学技术的快速发展,越来越多的难加工材料的使用对加工的要求越来越高。特别是在难加工材料的钻削加工过程中容易出现入钻精度低、缠刀、排屑性差、钻头磨损严重甚至折断和出口毛刺过大等一系列的问题,普通钻削加工已经不能满足高质量的加工要求。超声振动钻削的加工方式便应运而生,超声振动钻削是在传统钻削的基础上结合了轴向超声振动所形成的新型加工工艺,它从本质上改变钻削机理,将传统钻削工艺的连续加工转化为周期性
随着机器人的普及和运用,机器人的应用场景越来越复杂化、多样化,这对机器人的结构和运行方式也提出了一些新的要求。机器人要有对一些结构复杂、布局紧凑的工业操作环境或非机构化自然环境的适应能力,这就需要研究开发更具灵活性的机器人来满足这样的需求。仿生机器人通过模仿生物体独特的运动特性,能够适应各种复杂的环境。随之衍生而来的蛇形机器人,具有可达性好、柔软程度高、工作性能稳定等优点,可用来完成工业上狭小受限