论文部分内容阅读
摘 要: 关联规则是一种广泛应用于生产制造业中的数据挖掘方法,本文介绍了关联规则的基本定义和算法,介绍了半导体LED芯片制造的主要流程,阐述了关联规则对半导体LED芯片制造流程中多工序质量控制的作用,为半导体产品制造中多工序质量控制提供了一种有效方法。
关键词:关联规则;多工序质量控制;质量传递;LED芯片制造
作为数据挖掘方法之一的关联规则,被广泛应用于产品的生产制造过程中,从产品的设计阶段到产品的销售使用过程中均有体现。使用关联规则可以有效的识别数据库中数据项之间的关系。这些关系并非是基于数据本身的固有属性并依赖函数关系,而是基于数据项的共生。因此基于生产制造过程所行程的庞大而繁杂的数据库,通过研究工序间质量特性的关联以及质量特性与影响因素间的关联,将看似无关的过程及结果进行对照,分析得到其关联规则,往往可以迅速而准确的找出质量波动的根源,为质量改进提供可靠的依据;而根据关联分析的结果对质量波动进行预测,形成对质量波动的预防和提前的纠正,减少质量损失、降低生产成本。
以集成电路及LED为代表的半导体行业作为新兴的高科技产业,制造工序复杂,工序相互独立而结果又相互影响,甚至一道工序结果影响后道多道工序质量。因此其产品的质量控制尤为困难。通过引入关联规则的统计学方法,我们得以更好的利用企业在制造过程中收集记录的大量数据,进行有效挖掘工序间隐蔽的影响因素,从而达到优化工序的工艺条件,降低质量异常发生频率的目的。
一、关联规则及其基本算法
关联规则是从搜索的可能规则中,根据其支持度、置信度和增益等衡量指标,筛选出具有足够支持度的所有高频项目集,从中找出属性或项目间有所关联的规则。
关联规则的定义如下,令是所有相异项目(item)的集合,称为事务数据库。而任务相关的数据D是数据库中事务的集合,其中每个事务T是项的集合,使得。每一个事务均有一个标识符,称为TID。设A是一个项集,事务T包含A且仅当。关联规则是形如A→B的蕴含式,其中,并且。
此外需要关注的三项衡量指标:
(一)支持度(support):支持度衡量前提项目X与结果项目Y一起出现的概率P 表示该规则在全部交易记录中出现的比率。
支持度表示关联规则相对与全部数据必需具有一定的普遍性,才是有效的信息。而最小支持度主要用于评价关联规则所必需涵盖的最少数据比率。
(二)置信度(confidence):置信度衡量前提项目X发生的情况下,结果项目Y发生的条件概率,即,表示对当前提项目X发生时,可以推得结果项目Y的规则的正确性的信心程度。
置信度是衡量关联规则是否具有可信度的指标,因此置信度通常需要达到一定水平(大都为0.5),利用最小置信度去除正确概率较低的关联规则。
(三)增益(lift):增益衡量用于比较置信度与结果项目Y单独发生时两者概率间的大小,即。
进行关联规则的分析时,通常会先设定挖掘所得的跪着的支持度与置信度的门槛值,以作为挑选关联规则的准则。由此筛选出的规则必须满足决策者规定的最小支持度和最小置信度。当满足这两个条件后,再判读这些规则的增益值是否大于1;大于1则保留,反之筛除。当这三个指标皆成立时,即为所推导的关联规则。
常见的关联规则算法包括Apriori算法、Partition算法、DHP算法、MSApriori算法以及FP-Growth算法。这些算法均通过由下往上逐步搜索高频项目集以及候选项目集,从而逐一的找出其中的显著的关联法则。
通过关联规则,我们通常可以挖掘到与常规认知相符的规则,例如“购买桌子→购买椅子”;也会发现难以解释、常规认识很难发现的规则。对于实际生产过程中的质量管控,使用关联规则的方法可以分析发生的质量问题与作业员工、作业时间等等不可控的条件的关系;可以进行跨工序的工艺条件分析;可以分析发生缺陷与经过生产设备的关联性分析,从而评估需要进行重点监控的设备;也可以分析最终产品的质量异常与质量监控点间的关联分析,从而进行质量监控点设置的优化,等等。
关联规则的分析结果可以挖掘出许多数据库项目之间的联系与相互规则,以作为有用的决策依据,其优点是能从庞大且目标未知的数据库中找出显著性规则,同时对数据库中的数据属性没有严格限制,计算模式简单易懂。但是,当需要分析的对象数量增加、类别增多时,其运算的复杂程度会呈几何级数增加,造成时间耗费,因此需要注意适当选择分析对象,尽可能的避免建立事务过多的项集,造成盲目分析。
二、关联规则在LED芯片制造多工序质量控制的应用
(一) LED产品制造主要工序流程
发光二极管(LED,light-emitting diode)是在半导体技术将人类带入信息时代的背景下,人类致力于开发节能环保新光源的同时,带动了半导体材料的研究和应用的大环境中应运而生的。LED是一種半导体二极管光电子器件,具有效率高,寿命长,不易破坏,反应速度快,可靠性强等传统光源无可比拟的优点而备受青睐。LED在内部结构上有P区和N区,两区相交而形成PN结,P区带有过量的空穴,N区带有过量的电子,并朝对方扩散直至一个特殊的平衡状态。工作时,在正向偏压下,即P型材料接正极,N型材料接负极时,电子发生移动造成非平衡状态,同时半导体中的电子和空穴产生复合而发射光子,从而使得PN结能够发光。
LED的基本结构是一块电致发光的半导体材料,置于一个有引线的支架上,四周用环氧树脂进行密封提供保护,如图1所示。
作为LED最主要的构成部分,LED芯片决定了的LED主要性能状况。芯片由P型层、N型层、发光层、外延层、衬底、P型电极、N型电极、透明导电层等部件构成,具体结构如图2所示。
LED芯片的主要制造工艺包括:光刻工艺,刻蚀工艺,薄膜沉积工艺,快速热退火工艺,研磨和抛光等,具体工艺流程如下: (二) LED芯片制造过程的质量控制
对于一件产品,其制造过程是指从原材料采购开始直到产成品入库为止的全过程。这个过程涉及的质量职能包括了:生产技术准备、生产过程控制、工序管理、质量检验、现场质量信息管理等等。产品质量作为产品的一组固有的特性,在设计确定后,为了保证能够如设计要求的满足预期的质量水平和用户满意度,就需要在生产过程控制中对产品的质量进行控制,因此首先就需要确认其制造过程中各个阶段在产品的质量特性,并根据这些质量特性来确认整个制造过程的质检工序。
由于半导体制作过程通常都存在制作工序长、工艺复杂的问题,而为了保证工序过程流畅、制作成本可以接受,往往不会逐步设立质检工序,而是在连续几部工序后进行检验、控制其质量状况。例如光刻工艺,通常不会在整个光刻工艺过程中进行检验,而是待全部完成后进行检验,筛出不符合质量要求的在产品。
當一道检验工序建立,检验的具体项目需要能够在一定程度上与前道或更前道工序、后道或更后道工序的检验结果相互呼应,找出其中影响产品质量特性的因素,把制造过程质量影响因素和质量特性联系起来,可以更好的进行质量控制。
刻蚀图形尺寸是LED芯片生产过程中最基础的产品参数之一,而影响图形尺寸的影响因素包括了刻蚀工序的部分参数,包括选择比、刻蚀速率、均匀性等等。而前道的光刻工艺则会直接影响到这些参数,对应的影响了刻蚀图形的尺寸。所以为了满足刻蚀图形尺寸的要求,光刻工艺就需要相对应的控制,例如,光刻机使用的光源通常为汞灯,汞灯随着使用时间的增长其能量会逐步降低。为了保证光刻工序的分辨率及深度,因此需要随着时间的延长增加光刻时间来进行弥补。
因此,对应LED芯片制造过程,与其它生产制造过程一样,其质量控制过程由质量特性的检验与影响质量特性因素的监控构成。对此,通常都是由SPC等的方法来完成的,控制方法方便、高效。但是对于LED制造过程,无论多个因素影响一个质量特性,还是一道工序的结果影响其后数道工序的结果,再加之LED芯片的制造过程往往会划分为数个子过程,由不同的工厂完成,很多影响因素无法通过直接的数字进行表示,这样进行质量控制时会出现一些很难确定的因素,影响整体产品的质量控制。
(三)关联规则对多工序质量控制的影响
早在1981年,张公绪就提出了两种质量概念来表示上下工序间质量的影响关系,分质量和总质量,后者就是原有质量概念所认为的质量,而前者则可以反应工序的工作质量,与上道工序已形成的产品或在产品无关。他认为产品总质量=分质量+上道工序对本道工序的影响。而对于LED制造工序,由于可能是多步工序构的影响构成一个质量特性,因此分质量的概念需要进行进一步的延伸,其包含的质量要素应包括之前的数道工序甚至全部工序的工序。例如,前文提到的选择比,从光刻工艺的初始工序匀胶到最后工序后烘都对其产生直接的影响。匀胶工序的烘烤温度、后烘的烘烤时间和温度、湿度等等,都直接影响光刻工艺制作的PR掩模的选择比。因此分质量已经不是仅仅一道工序的质量表征。
关联规则的一个很明显的优势是它可以忽略具体的数字,而以明显的事物集来进行对比,找出其中的高频数集,就可以找到所需要的对应关系。而且存在多个因素影响时,同样可以进行直接的关联分析。对于多工序质量控制需要关注的质量传递问题,通过质量特性之间的关联行分析以及质量特性与制造过程影响因素的关联性分析来表达质量特性在工序间及每道工序中质量特性与其影响因素间的传递、积累、相互影响、相互作用关系无疑是很好的控制方法。通过这种关联性分析将制造过程中所有工序的质量特性及每道工序的质量特性与其影响因素串联起来进而形成了集成管理的链条结构,有效的解决通常将各道工序看作独立的而忽略工序间联系的问题,为制造过程质量问题的溯源提供一个有效的工具。
三、结语
关联规则作为现代数据挖掘分一种常用的分析方法在工业生产过程中具有极高的适用性,尤其是在质量管理方面,关联规则较常规的质量控制方法更为高效的利用的生产数据库中的信息,使得复杂的制造工艺中出现的问题被迅速识别。半导体产品的制造工序,工序复杂、流程漫长其各工序相关性强,这使得工序质量控制颇为困难并提高了其质量成本,引入关联规则分析可以有效的优化这个过程,起到提高质量控制能力与降低质量成本的目的。
参考文献:
[1] 张公绪,孙静. 新编质量管理学[M]. 北京:高等教育出版社,2003.
[2] 王成柱. 制造过程质量管理探讨[J]. 工业工程与管理,1998(5): 41-44.
[3] 刘帅帅. 多工序制造过程质量特性关联性研究及应用[D]. 重庆:重庆大学, 2010.
[4] 简祯富,许嘉裕. 大数据分析与数据挖掘[M]. 北京:清华大学出版社,2016.
[5] 杨林. LED照明的质量可靠性研究分析[M]. 北京:电子工业出版社,2015.
关键词:关联规则;多工序质量控制;质量传递;LED芯片制造
作为数据挖掘方法之一的关联规则,被广泛应用于产品的生产制造过程中,从产品的设计阶段到产品的销售使用过程中均有体现。使用关联规则可以有效的识别数据库中数据项之间的关系。这些关系并非是基于数据本身的固有属性并依赖函数关系,而是基于数据项的共生。因此基于生产制造过程所行程的庞大而繁杂的数据库,通过研究工序间质量特性的关联以及质量特性与影响因素间的关联,将看似无关的过程及结果进行对照,分析得到其关联规则,往往可以迅速而准确的找出质量波动的根源,为质量改进提供可靠的依据;而根据关联分析的结果对质量波动进行预测,形成对质量波动的预防和提前的纠正,减少质量损失、降低生产成本。
以集成电路及LED为代表的半导体行业作为新兴的高科技产业,制造工序复杂,工序相互独立而结果又相互影响,甚至一道工序结果影响后道多道工序质量。因此其产品的质量控制尤为困难。通过引入关联规则的统计学方法,我们得以更好的利用企业在制造过程中收集记录的大量数据,进行有效挖掘工序间隐蔽的影响因素,从而达到优化工序的工艺条件,降低质量异常发生频率的目的。
一、关联规则及其基本算法
关联规则是从搜索的可能规则中,根据其支持度、置信度和增益等衡量指标,筛选出具有足够支持度的所有高频项目集,从中找出属性或项目间有所关联的规则。
关联规则的定义如下,令是所有相异项目(item)的集合,称为事务数据库。而任务相关的数据D是数据库中事务的集合,其中每个事务T是项的集合,使得。每一个事务均有一个标识符,称为TID。设A是一个项集,事务T包含A且仅当。关联规则是形如A→B的蕴含式,其中,并且。
此外需要关注的三项衡量指标:
(一)支持度(support):支持度衡量前提项目X与结果项目Y一起出现的概率P 表示该规则在全部交易记录中出现的比率。
支持度表示关联规则相对与全部数据必需具有一定的普遍性,才是有效的信息。而最小支持度主要用于评价关联规则所必需涵盖的最少数据比率。
(二)置信度(confidence):置信度衡量前提项目X发生的情况下,结果项目Y发生的条件概率,即,表示对当前提项目X发生时,可以推得结果项目Y的规则的正确性的信心程度。
置信度是衡量关联规则是否具有可信度的指标,因此置信度通常需要达到一定水平(大都为0.5),利用最小置信度去除正确概率较低的关联规则。
(三)增益(lift):增益衡量用于比较置信度与结果项目Y单独发生时两者概率间的大小,即。
进行关联规则的分析时,通常会先设定挖掘所得的跪着的支持度与置信度的门槛值,以作为挑选关联规则的准则。由此筛选出的规则必须满足决策者规定的最小支持度和最小置信度。当满足这两个条件后,再判读这些规则的增益值是否大于1;大于1则保留,反之筛除。当这三个指标皆成立时,即为所推导的关联规则。
常见的关联规则算法包括Apriori算法、Partition算法、DHP算法、MSApriori算法以及FP-Growth算法。这些算法均通过由下往上逐步搜索高频项目集以及候选项目集,从而逐一的找出其中的显著的关联法则。
通过关联规则,我们通常可以挖掘到与常规认知相符的规则,例如“购买桌子→购买椅子”;也会发现难以解释、常规认识很难发现的规则。对于实际生产过程中的质量管控,使用关联规则的方法可以分析发生的质量问题与作业员工、作业时间等等不可控的条件的关系;可以进行跨工序的工艺条件分析;可以分析发生缺陷与经过生产设备的关联性分析,从而评估需要进行重点监控的设备;也可以分析最终产品的质量异常与质量监控点间的关联分析,从而进行质量监控点设置的优化,等等。
关联规则的分析结果可以挖掘出许多数据库项目之间的联系与相互规则,以作为有用的决策依据,其优点是能从庞大且目标未知的数据库中找出显著性规则,同时对数据库中的数据属性没有严格限制,计算模式简单易懂。但是,当需要分析的对象数量增加、类别增多时,其运算的复杂程度会呈几何级数增加,造成时间耗费,因此需要注意适当选择分析对象,尽可能的避免建立事务过多的项集,造成盲目分析。
二、关联规则在LED芯片制造多工序质量控制的应用
(一) LED产品制造主要工序流程
发光二极管(LED,light-emitting diode)是在半导体技术将人类带入信息时代的背景下,人类致力于开发节能环保新光源的同时,带动了半导体材料的研究和应用的大环境中应运而生的。LED是一種半导体二极管光电子器件,具有效率高,寿命长,不易破坏,反应速度快,可靠性强等传统光源无可比拟的优点而备受青睐。LED在内部结构上有P区和N区,两区相交而形成PN结,P区带有过量的空穴,N区带有过量的电子,并朝对方扩散直至一个特殊的平衡状态。工作时,在正向偏压下,即P型材料接正极,N型材料接负极时,电子发生移动造成非平衡状态,同时半导体中的电子和空穴产生复合而发射光子,从而使得PN结能够发光。
LED的基本结构是一块电致发光的半导体材料,置于一个有引线的支架上,四周用环氧树脂进行密封提供保护,如图1所示。
作为LED最主要的构成部分,LED芯片决定了的LED主要性能状况。芯片由P型层、N型层、发光层、外延层、衬底、P型电极、N型电极、透明导电层等部件构成,具体结构如图2所示。
LED芯片的主要制造工艺包括:光刻工艺,刻蚀工艺,薄膜沉积工艺,快速热退火工艺,研磨和抛光等,具体工艺流程如下: (二) LED芯片制造过程的质量控制
对于一件产品,其制造过程是指从原材料采购开始直到产成品入库为止的全过程。这个过程涉及的质量职能包括了:生产技术准备、生产过程控制、工序管理、质量检验、现场质量信息管理等等。产品质量作为产品的一组固有的特性,在设计确定后,为了保证能够如设计要求的满足预期的质量水平和用户满意度,就需要在生产过程控制中对产品的质量进行控制,因此首先就需要确认其制造过程中各个阶段在产品的质量特性,并根据这些质量特性来确认整个制造过程的质检工序。
由于半导体制作过程通常都存在制作工序长、工艺复杂的问题,而为了保证工序过程流畅、制作成本可以接受,往往不会逐步设立质检工序,而是在连续几部工序后进行检验、控制其质量状况。例如光刻工艺,通常不会在整个光刻工艺过程中进行检验,而是待全部完成后进行检验,筛出不符合质量要求的在产品。
當一道检验工序建立,检验的具体项目需要能够在一定程度上与前道或更前道工序、后道或更后道工序的检验结果相互呼应,找出其中影响产品质量特性的因素,把制造过程质量影响因素和质量特性联系起来,可以更好的进行质量控制。
刻蚀图形尺寸是LED芯片生产过程中最基础的产品参数之一,而影响图形尺寸的影响因素包括了刻蚀工序的部分参数,包括选择比、刻蚀速率、均匀性等等。而前道的光刻工艺则会直接影响到这些参数,对应的影响了刻蚀图形的尺寸。所以为了满足刻蚀图形尺寸的要求,光刻工艺就需要相对应的控制,例如,光刻机使用的光源通常为汞灯,汞灯随着使用时间的增长其能量会逐步降低。为了保证光刻工序的分辨率及深度,因此需要随着时间的延长增加光刻时间来进行弥补。
因此,对应LED芯片制造过程,与其它生产制造过程一样,其质量控制过程由质量特性的检验与影响质量特性因素的监控构成。对此,通常都是由SPC等的方法来完成的,控制方法方便、高效。但是对于LED制造过程,无论多个因素影响一个质量特性,还是一道工序的结果影响其后数道工序的结果,再加之LED芯片的制造过程往往会划分为数个子过程,由不同的工厂完成,很多影响因素无法通过直接的数字进行表示,这样进行质量控制时会出现一些很难确定的因素,影响整体产品的质量控制。
(三)关联规则对多工序质量控制的影响
早在1981年,张公绪就提出了两种质量概念来表示上下工序间质量的影响关系,分质量和总质量,后者就是原有质量概念所认为的质量,而前者则可以反应工序的工作质量,与上道工序已形成的产品或在产品无关。他认为产品总质量=分质量+上道工序对本道工序的影响。而对于LED制造工序,由于可能是多步工序构的影响构成一个质量特性,因此分质量的概念需要进行进一步的延伸,其包含的质量要素应包括之前的数道工序甚至全部工序的工序。例如,前文提到的选择比,从光刻工艺的初始工序匀胶到最后工序后烘都对其产生直接的影响。匀胶工序的烘烤温度、后烘的烘烤时间和温度、湿度等等,都直接影响光刻工艺制作的PR掩模的选择比。因此分质量已经不是仅仅一道工序的质量表征。
关联规则的一个很明显的优势是它可以忽略具体的数字,而以明显的事物集来进行对比,找出其中的高频数集,就可以找到所需要的对应关系。而且存在多个因素影响时,同样可以进行直接的关联分析。对于多工序质量控制需要关注的质量传递问题,通过质量特性之间的关联行分析以及质量特性与制造过程影响因素的关联性分析来表达质量特性在工序间及每道工序中质量特性与其影响因素间的传递、积累、相互影响、相互作用关系无疑是很好的控制方法。通过这种关联性分析将制造过程中所有工序的质量特性及每道工序的质量特性与其影响因素串联起来进而形成了集成管理的链条结构,有效的解决通常将各道工序看作独立的而忽略工序间联系的问题,为制造过程质量问题的溯源提供一个有效的工具。
三、结语
关联规则作为现代数据挖掘分一种常用的分析方法在工业生产过程中具有极高的适用性,尤其是在质量管理方面,关联规则较常规的质量控制方法更为高效的利用的生产数据库中的信息,使得复杂的制造工艺中出现的问题被迅速识别。半导体产品的制造工序,工序复杂、流程漫长其各工序相关性强,这使得工序质量控制颇为困难并提高了其质量成本,引入关联规则分析可以有效的优化这个过程,起到提高质量控制能力与降低质量成本的目的。
参考文献:
[1] 张公绪,孙静. 新编质量管理学[M]. 北京:高等教育出版社,2003.
[2] 王成柱. 制造过程质量管理探讨[J]. 工业工程与管理,1998(5): 41-44.
[3] 刘帅帅. 多工序制造过程质量特性关联性研究及应用[D]. 重庆:重庆大学, 2010.
[4] 简祯富,许嘉裕. 大数据分析与数据挖掘[M]. 北京:清华大学出版社,2016.
[5] 杨林. LED照明的质量可靠性研究分析[M]. 北京:电子工业出版社,2015.