基于线性判别分析的公理模糊集分类模型研究

来源 :大连理工大学 | 被引量 : 2次 | 上传用户:dy_dj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,机器学习方兴未艾,吸引着大量的研究者投入时间与精力。人类迫切地需要一种强大的拥有一定智慧的算法来提高生产力,机器学习似乎给出了一个方向。常见的机器学习算法,如支持向量机、朴素贝叶斯、神经网络等算法模型为许多实际问题提供了解决的方案,在工业,图像识别,商业策略在内的诸多领域,机器学习正显示着它越来越强大的能力。而就机器学习的需要完成的任务而言,分类任务无疑是其中的重中之重。在现实世界中,分类任务总是随处可见。如车牌号的识别,动物图片的识别等等,分类是自然界中最基础的任务之一。因此,分类理论与分类模型的研究一直是学者们关注与研究的重点。于是在人工智能已成为研究热点的现在,不同的算法与模型迎来了爆发式的发展,这其中既包括了传统的分类模型,又包括了神经网络在内的新崛起的智能分类模型。然而大多数研究者更加关注学习模型的准确性和速度,他们忽略了模型的可解释性和可理解性。但是一定的可解释性和理解性对于一个模型来说是非常重要的。黑盒模型总是让人觉得不可理解,甚至让人感到些许的不可靠,因为我们无法保证它在特定情况下不会犯错,也无法预知它会在何时何地犯错以及它犯错的原因。黑盒模型就像是一个神奇的机器,它会帮我们解决一些问题,但是我们永远无法知道它是怎么解决问题的。本文为了使模型具有一定的可解释性和可理解性,将公理模糊集和线性鉴别分析结合在一起。利用线性鉴别分析将数据集中的样本降维到一个超平面上,这样使得数据集中不同类的样本之间能够拥有更好区分的特征。通过公理模糊集理论给出的语义描述,对不同的类别能够确定一个合理的类描述,并以此作为分类的依据,新的样本将会被判定属于在类描述上隶属度最高的那个类。这种分类方式使得模型在一定程度上具有可解释性,易于人们理解。在某种程度上,我们可以预知模型的行为,当它发生错误时,能够定位到出错的逻辑在哪里。本文的算法模型在开源数据集上与其他机器学习的分类算法做了对比实验,实验结果表明,本文的算法模型在多数的数据集上有着更高的准确率,并且结果预测的方差也更小,说明本文的算法模型有着更为强大的泛化能力和稳定性。最后,本文使用最新流行的数据分析语言Python以及网络框架Django搭建了网络分析平台,利用可视化的操作界面,以便本文算法模型的使用和调试。
其他文献
针对自训练方法在迭代中选出的置信度高的无标记样本所含信息量不大和自训练方法容易误标记无标记样本的问题,提出了一种结合半监督聚类和数据剪辑的NaiveBayes自训练方法。该
研究区区域大地构造位置地处三江特提斯构造域北段,属羌塘-昌都陆块类乌齐-左贡陆缘盆地。该区域由NW-SE向弧形构造组成,且NW-SE向弧形构造规模巨大,并发育有一系列大型逆冲
云南省洱源县历史上是牛巴氏杆菌病(牛出败)疫区,多数镇乡历史上都曾发生过牛巴氏杆菌病,部分偏远山区水、黄牛至今仍时有发生,有时甚至呈暴发性流行。但坝区奶牛巴氏杆菌病已十分
基于中国大陆西部地区(108°E以西)地磁台站数据,利用平滑伪魏格纳-维勒(SPWVD)分析方法,对其进行时频计算。通过对2007年至2015年间的MS6.3以上强震(选取岷县地震、芦山地震、鲁甸地震3个典型震例)周围台站地磁Z分量滤波后周期为4.4h的振幅变化进行分析,得到如下结论:(1)在3个强震发生前,周围台站的Z分量4.4h振幅在1个月内都出现了多台同步高值异常;(2)岷县地震、芦山地震发
利用双轴伺服控制加载装置,在干燥和饱和水(浸在水中)条件下,开展了砂岩、大理岩和花岗岩的摩擦实验。对比干湿条件下断层摩擦应力和声发射的演化特征,讨论水对断层滑动性状的
语文课是学习其他学科的基础:而阅读教学又是语文课中的基础。学生只有掌握了一定的阅读能力,才能进一步锻炼、培养写作的技能。在与其他学科的比较中,阅读能力作为基础的地位更
中学语文阅读教学方法很多,如指导学生感知全文大意、引导学生概括主题;指导学生分析结构、指导学生分析人物形象、指导学生赏析语言等。