论文部分内容阅读
数据信息采掘技术是指综合运用多种算法,对从各种渠道得来的大量数据 进行计算机处理,通过信息加工,抽提有用信息,发现自然规律。本文除了把 最近邻法最新应用到数据采掘的特征筛选步骤中外,主要介绍了数据采掘技术 在三元合金系中间化合物形成规律的研究、汽车零件的防腐蚀措施优化、钢板 反弹因素的研究、DNA芯片检验自动化和降低某大型企业成本的分析等问题中 的应用: 1.最近邻(KNN)法是一种模式识别分类方法,有关它的研究大多在K的选 值、提高计算速度和近邻规则的选取等方面。本文工作把KNN法用于数据采 掘的特征筛选步骤中,通过与传统的特征筛选方法的比较,证明KNN方法比 PCA、PLS和KW方法更适合于包容型数据的变量筛选。 2.Miedema提出的合金元胞模型认为两种金属间的电负性(Φ)差和Wagner- Seize元胞价电子云密度(nWS1/3)差与中间相的形成有关。考虑到三元合金 系中间化合物形成情况更加复杂,我们引入了另外两个原子参数,即表征几 何性质的半径(R)和表征能带因素的价电子数(Z),以这四个原子参数 或它们的函数作为特征变量,用数据采掘方法研究三元合金系金属间化合物 的形成规律,找出中间化合物形成的数学模型,并在此基础上编制了一个能 预报三元合金系中间化合物形成与否的专家系统(TICP)。经初步测定, TICP的误报率为2.56%,正确预报率为91.03%,不可预报的为6.41%。 3.汽车制造公司常用电镀锌、喷涂油漆和电沉积橡皮等作为汽车部件的防腐蚀 措施。用数据采掘技术对其中的部分防腐蚀数据进行分析处理,找出了汽车 部件的腐蚀速率与镀锌厚度、涂漆程度和沉积橡皮程度之间的关系,可据此 建模和优化。 4.用数据采掘技术研究了板材冲压反弹现象,证明板材反弹除与外部环境、反 应条件有关外,还与被冲压的板材的自身厚度有关。 5.建立了26组激光光谱数据与DNA芯片对应关系的数学模型,使DNA芯片的 产品检验自动化成为可能。 ———————————一N————- 中国科学院上海冶金研究所博士论文 姚莉秀2000年4月 6.针对某生产复印机的公司在各个销售区的维修费用差别很大的问题,用数据 采掘技术分析了该公司某种型号的复印机维修一年的记录,从中找出三个影 响维修成本的主要因素:使用频率、牺牲小齿轮保护大滚筒、几种零件维护 的节奏合理化。并在此基础上提出三条合理化建议。