论文部分内容阅读
随着全球经济迅猛发展,市场竞争已经发展成为供应链与供应链之间的竞争。供应链管理模式作为一种新的管理理念与模式,近年来在国内外逐渐受到重视,被视为是企业提升市场竞争力的助推剂。在供应链管理模式中,拥有优秀的供应商合作伙伴是企业竞争致胜的关键,而对供应商信用进行正确评价是企业组建优秀供应商团队的重要因素。因此,对供应商的信用进行准确评价具有重要意义。基于供应商信用评价在大数据环境下的实质为一种模式识别问题,分类机的性能表现在供应商的信用评价问题中至关重要。xgboost集成学习框架是2015年被提出种新的集成学习模型,它以其出色分类性能和鲁棒性在模式识别问题上得到了较为广泛的使用。鉴于此,本文尝试将xgboost集成学习框架应用于解决供应商的信用评价问题。xgboost框架在使用时,需要设置模型参数收缩步长和子节点中最小的样本权重阀值。通常,参数组合的选取对模型的分类性能影响较大。以往的参数寻优方法,主要依据经验给定或实验穷举,但带有一定的不确定性和随机性。本文将人工化学反应优化算法(Artificial Chemical Reaction Optimization Algorithm, ACROA)应用于xgboost框架的参数寻优,并设定不同的初始反应物个数进行数值实验,验证基于ACROA算法的参数寻优的稳定性。LMT (Logistic Model Tree)算法是决策树的一种扩展算法,它将普通的决策树模型和Logistic回归模型相结合,比单独的决策树模型和Logistic回归模型具有更强的分类性能。为进一步提高LMT算法的分类性能和解释能力,本文将反正切Lasso惩罚函数引入LMT模型,并通过实验验证反正切Lasso对LMT算法分类性能的优越性。为提高供应商信用评价中分类模型的分类精度和鲁棒性,本文提出了一种基于优化的xgboost-LMT模型——使用ACROA算法对xgboost框架进行参数寻优,并将基于反正切Lasso惩罚函数的LMT算法引入xgboost框架,作为框架的基分类器(Based Learner)。本文在两个真实的供应商信用数据集上进行对比实验,对比算法包括本文提出的基于优化的xgboost-LMT模型、独立基于反正切Lasso惩罚函数的LMT模型、支撑向量机、人工神经网络和C4.5决策树。实验结果表明:本文提出的供应商信用评价算法有效可行,在准确度、查全率和AUC方面,比其它四种算法有明显提升;并且,当数据集中包含异常值时,本文提出的分类算法具有良好的鲁棒性。