论文部分内容阅读
判别分析是用于判别个体所属类别的一种统计分析方法,其在自然科学、社会学及经济管理学等学科中都有着广泛的应用。多年来,通过统计学家以及各个行业领域研究人员的共同努力和开拓,判别分析的内容日益丰富,方法也越来越多,判别分析方法之间的比较研究一直以来也是一个颇受关注的话题。但是,至今还难以评价哪一种判别方法最好。
经过分析总结发现,为了体现研究方法的创新性和先进性,许多研究人员更加倾向于使用Logistic回归模型,而渐渐忽视了传统的判别分析方法,例如贝叶斯判别方法。然而,应用Logistic回归模型做判别分析是否总能够得到较好的判别效果?本文从理论和实证两个方面综合比较评价了两种判别分析方法,希望能对判别分析方法的选择和应用提供些许建议。
本文在借鉴国内外专家学者分析研究经验的基础上,首先系统阐述介绍了贝叶斯判别方法与Logistic回归模型的起源背景、判别理论、并从模型的适用条件、模型性质、二者之间的关系等方面进行了较为深入的探讨对比,分别指出了两个判别分析模型的特点。
为了更加深入、直观地比较贝叶斯判别方法与Logistic回归模型的运算效率、判别效果,本文应用UCI标准测试数据集从实证分析的角度对两种判别分析模型的判别效果进行了测试。基于六个UCI测试数据集的测试结果得到如下四个结论:贝叶斯判别方法得出的误判概率比Logistic回归模型得到的波动范围小;随着训练集样本量的增大,贝叶斯判别方法趋近于渐进误判概率的速度要快于Logistic回归模型;在训练集样本量较小的情况下,贝叶斯判别分析的表现要比Logistic回归模型的表现好,而当样本量比较大的时候,Logistic回归模型的表现要好于贝叶斯判别方法;Logistic回归模型的运算效率高于贝叶斯判别方法。