论文部分内容阅读
当今时代,机器学习方兴未艾,吸引着大量的研究者投入时间与精力。人类迫切地需要一种强大的拥有一定智慧的算法来提高生产力,机器学习似乎给出了一个方向。常见的机器学习算法,如支持向量机、朴素贝叶斯、神经网络等算法模型为许多实际问题提供了解决的方案,在工业,图像识别,商业策略在内的诸多领域,机器学习正显示着它越来越强大的能力。而就机器学习的需要完成的任务而言,分类任务无疑是其中的重中之重。在现实世界中,分类任务总是随处可见。如车牌号的识别,动物图片的识别等等,分类是自然界中最基础的任务之一。因此,分类理论与分类模型的研究一直是学者们关注与研究的重点。于是在人工智能已成为研究热点的现在,不同的算法与模型迎来了爆发式的发展,这其中既包括了传统的分类模型,又包括了神经网络在内的新崛起的智能分类模型。然而大多数研究者更加关注学习模型的准确性和速度,他们忽略了模型的可解释性和可理解性。但是一定的可解释性和理解性对于一个模型来说是非常重要的。黑盒模型总是让人觉得不可理解,甚至让人感到些许的不可靠,因为我们无法保证它在特定情况下不会犯错,也无法预知它会在何时何地犯错以及它犯错的原因。黑盒模型就像是一个神奇的机器,它会帮我们解决一些问题,但是我们永远无法知道它是怎么解决问题的。本文为了使模型具有一定的可解释性和可理解性,将公理模糊集和线性鉴别分析结合在一起。利用线性鉴别分析将数据集中的样本降维到一个超平面上,这样使得数据集中不同类的样本之间能够拥有更好区分的特征。通过公理模糊集理论给出的语义描述,对不同的类别能够确定一个合理的类描述,并以此作为分类的依据,新的样本将会被判定属于在类描述上隶属度最高的那个类。这种分类方式使得模型在一定程度上具有可解释性,易于人们理解。在某种程度上,我们可以预知模型的行为,当它发生错误时,能够定位到出错的逻辑在哪里。本文的算法模型在开源数据集上与其他机器学习的分类算法做了对比实验,实验结果表明,本文的算法模型在多数的数据集上有着更高的准确率,并且结果预测的方差也更小,说明本文的算法模型有着更为强大的泛化能力和稳定性。最后,本文使用最新流行的数据分析语言Python以及网络框架Django搭建了网络分析平台,利用可视化的操作界面,以便本文算法模型的使用和调试。