论文部分内容阅读
随着工业生产和科学技术的快速发展,对质量要求越来越高。近几十年代以来,伴随着大型设备例如:人造卫星、火箭、宇宙飞船等的不断出现,社会开始出现对产品的可靠性、安全性、经济性等要求越来越高的一种现象,因此产品的质量提高就成为迫切要解决的问题。在整个质量管理的流程当中,不论是质量控制,还是决策分析,都需要对大量的历史的质量数据进行全面的分析研究,以帮助质量管理的决策者来进行高效的判断。而面对生产过程中高维的数据记录,能够高效的识别产品的质量类别,这将具有十分重要的现实意义。在质量类别的分类过程当中,由于社会工业的发展,企业对质量数据要求不断的提高。又由于现在的质量数据呈现出多维性,而且数据量在不断地增加,这就对质量类别的判断提高了要求。同时很多有用的信息数据输入错误、不同来源数据引起的不同表示方法,数据间的不一致等,导致现有的数据中存在数据质量问题。而传统的质量数据分类很难高效地解决上面出现的确定性而且也很难保证其正确率,这就需要寻找适合分析解决以上问题的方法。以贝叶斯方法为理论基础的贝叶斯网络在处理质量管理中数据的分类中具有很多的优势。本文以质量管理中数据为研究背景,并针对海量数据分类的高效性进行研究,并对分类的结果进行分析。本文的主要工作可以概括为以下四个方面:1对质量管理及质量数据的特征和分类进行了介绍,并对贝叶斯网络在质量管理中的应用进行了概述。2对贝叶斯网络进行了概述,重点介绍了贝叶斯网络学习的方法以及学习方法的类型,最后还介绍了贝叶斯网络的构造。3针对质量数据各属性中存在的隐含依赖关系,并能提高分类的性能的基础上,论文先后提出了两种贝叶斯网络分类算法:一种是基于互信息的贝叶斯网络分类;另一种是改进的贝叶斯网络分类。可以认为后者是对前者的改进,并对两个分类的性能都作了相应的分析。在本章的最后,还提出了一个对朴素贝叶斯分类改进的算法,并对其算法性能也做了分析。4将论文中提出的三个贝叶斯网络分类算法应用到质量管理系统中进行实验,并且用质量管理中的数据集对算法进行了验证,实验结果说明了算法的可行性。将算法与其它分类算法相对比,显示出了算法的优越性与高效性。