论文部分内容阅读
摘 要:本文针对无车承运人平台线路运费定价进行了相关研究。首先进行数据预处理,并运用因子分析确定了影响货运线路定价的因素。再通过主因子的得分系数和方程贡献率计算各个影响因素的权重,最终得到影响定价的因素为总里程、是否续签、路程时间、车辆状况、业务类型、线路编码、需求类型2、运输等级、地区类型和需求紧急程度。
关键词:因子分析;货运路线;降维技术
1.引言
近年来,货运物流行业逐步与移动互联网技术深度结合,货运物流市场出现了无车承运人经营模式[1]。无车承运人通过物流信息平台向货主的运输任务和承运司机进行报价,并对车辆、站场、货源等零散物流资源进行集约整合和科学调度,以及对管理和组织模式的创新,有效提升了运输组织效率,推动货运物流行业转型升级[2]。但是随着我国无车承运行业的逐步兴起,承运线路的科学定价问题是众多无车承运人平台迫切需要解决的问题[3]。
2.模型的建立与求解
2.1 因子分析模型
因子分析能够在大部分变量中找出具有相关性的隐藏变量。其主要目的是把多数几个无关的变量通过降维技术变成少数几个相关的变量。
因子分析的基本步骤:
(1)计算相关系数矩阵R
(2)计算初等载荷矩阵解特征方程,得到特征根,再求出相对应的特征向量,最后得到初等载荷矩阵
(3)选择m个主因子并进行因子旋转根据载荷矩阵,构造出因子模型。
(4)计算因子得分和综合得分,求出单个影响因素的得分。
(5)计算单个影响因素权重
根据各因素在主因子中的得分和方程贡献率,计算各个因素的权重。
2.2 模型的求解
2.2.1 确定货运线路定价的影响因素
随着国内公路运输市场的开放,无车承运行业逐渐兴起,无车承运人面向广大拥有运力资源的司机,将需要承运的线路任务以一定价格提前发布到网络平台上供司机浏览,且在当前阶段较为关注的目标是快速促进成交和较低的承运成本。为了更好的确定货运线路的价格,即定价为被解释变量Y。
在经过数据预处理后,我们整理出11种影响因素。这11种因素分别为总里程,即任务里程;业务类型,即运输产品的大类,重货或速运(普通快递);需求类型2,即需求产生的形式,计划或临时。线路编码,即线路的定义为始发地地点+目的地地点+执行时间;是否续签,即若本期任务执行较好,可选择以某个价格在下个承包周期继续执行这些任务;车辆状况,即车辆长度和车辆吨位的乘积;运输等级,即运输任务的线路等级共分为三级;交易对象,即交易面向的司机类型共分为三类,其中B为承运商C为个体司机;路程时间,即计划到达时间与计划靠车时间之差;地区类型,即地区的类型共分为6类;需求紧急程度,即需求的紧急程度分为普通、紧急和特急三类。
通过数据预处理,得到了影响货运线路价格的11种影响因素,并且已经完成标准化处理。
(1)判断该数据是否适合进行因子分析首先运用SAS对进行标准化后的8种因素及其相关数据做KMO检验,判断该数据是否适合进行因子分析。
根据KMO的统计值发现,总体值为0.654,且大部分KMO的统计值在0.5~0.7左右,说明原变量比较适合进行因子分析。
(2)确定提取的公因子数目可根据特征值大于1和累计贡献率首次达到70%以上来判断。
经过分析研究可知,有3个特征值是大于1的,若按照特征根大于1的准则提取公因子,可以提取3个公因子;且若按累积贡献率首次达70%为准则提取公因子,也可以提取3个公因子。综上所述,提取3个公因子的效果较好。且累积贡献率高达77.19%,说明用这三个主因子解释货运线路定价已有77.19%的把握。
(3)写出旋转因子模型
旋转因子模型相比因子模型而言,可以更加直观的将多个因子分成少数的几个公因子。
经过分析可以得出11个影响因素共分为3个主因子。类型因子:业务类型、线路编码、是否续签、运输等级、交易对象和地区类型。数值因子:总里程、车辆状况和路程时间。需求因子:需求类型2和需求紧急程度。
(4)标准化得分方程:根据建立的因子模型,得到3个主因子的得分系数。从而可知每个主因子的系数,根据该系数,最终确定3个主因子的标准化得分方程。
再根据累积贡献率,我们计算得到3个主因子的权重分别为0.4264,0.3754,0.1982。由此可以得出综合得分方程为:
F=0.4264F1+0.3754F2+0.1982F3
根据主因子权重可知,F1类型主因子的权重最高,其次是F2数值主因子,最低的为F3
需求主因子。
为了判断这些因素是否能较好的反映货运线路的定价,需要计算单个影响因素的权重系数。通过主因子的得分系数和方程贡献率,计算得到11个影响因素的权重。
根据权重对11种影响因素的权重由大到小进行排序:总里程>是否续签>路程时间>车辆状况>业务类型>线路编码>需求类2>运输等级>地区类型>需求紧急程度>交易对象.由于交易对象影响因素权重只为0.0395,所占比重很小,且KMO检验值相对偏低,效果不好,所以考虑将这个影响因素剔除。最后得到影响货运线路的定价主要因素有:总里程、是否续签、路程时间、车辆状况、业务类型、线路编码、需求类型2、运输等级、地区类型和需求紧急程度共10种影响因素。
色阶颜色越浅代表变量之间的相关性越强,根据最后一列的定价Y可以直观看出与各个影响因素之间的相关关系。其中定价Y与总里程X1的相关系数高达0.99,说明总里程的数值越大,相应定价越高。同样的定价Y与车辆状况X6的相关系数高达0.92,说明车辆的吨位越重,车辆长度越长,相应定价越高。定价Y与路程时间X9的相关系数高达0.96,说明车辆的行驶时间越长,相应定价越高。
相反地,定价Y与运输等级X7的相关系数为-0.40,根据onehot编码中的一级运输编码较小为001,三级运输编码较大为100,说明运输等级中三级为低等级运输,相应的定价较低,一级为高级运输,相应定价较高。同样的,定价Y与需求紧急程度X11的相关系數为-0.10,根据onehot编码中的特急运输编码较小为001,常规运输编码较大为100,说明需求紧急程度中常规为低等级运输,相应的定价较低,特急为高级运输,相应定价较高。
参考文献:
[1]王学民.应用多元统计分析[M].上海:上海财经大学出版社,2017.
[2]胡书文,徐建武.主成分分析和因子分析在中国股票评价体系中的应用[J].重庆理工大学学报(自然科学),2017,31(05):192-202.
[3]傅依娴,芦天亮,马泽良.基于One-Hot的CNN恶意代码检测技术[J].计算机应用与软件,2020,37(01):304-308.
关键词:因子分析;货运路线;降维技术
1.引言
近年来,货运物流行业逐步与移动互联网技术深度结合,货运物流市场出现了无车承运人经营模式[1]。无车承运人通过物流信息平台向货主的运输任务和承运司机进行报价,并对车辆、站场、货源等零散物流资源进行集约整合和科学调度,以及对管理和组织模式的创新,有效提升了运输组织效率,推动货运物流行业转型升级[2]。但是随着我国无车承运行业的逐步兴起,承运线路的科学定价问题是众多无车承运人平台迫切需要解决的问题[3]。
2.模型的建立与求解
2.1 因子分析模型
因子分析能够在大部分变量中找出具有相关性的隐藏变量。其主要目的是把多数几个无关的变量通过降维技术变成少数几个相关的变量。
因子分析的基本步骤:
(1)计算相关系数矩阵R
(2)计算初等载荷矩阵解特征方程,得到特征根,再求出相对应的特征向量,最后得到初等载荷矩阵
(3)选择m个主因子并进行因子旋转根据载荷矩阵,构造出因子模型。
(4)计算因子得分和综合得分,求出单个影响因素的得分。
(5)计算单个影响因素权重
根据各因素在主因子中的得分和方程贡献率,计算各个因素的权重。
2.2 模型的求解
2.2.1 确定货运线路定价的影响因素
随着国内公路运输市场的开放,无车承运行业逐渐兴起,无车承运人面向广大拥有运力资源的司机,将需要承运的线路任务以一定价格提前发布到网络平台上供司机浏览,且在当前阶段较为关注的目标是快速促进成交和较低的承运成本。为了更好的确定货运线路的价格,即定价为被解释变量Y。
在经过数据预处理后,我们整理出11种影响因素。这11种因素分别为总里程,即任务里程;业务类型,即运输产品的大类,重货或速运(普通快递);需求类型2,即需求产生的形式,计划或临时。线路编码,即线路的定义为始发地地点+目的地地点+执行时间;是否续签,即若本期任务执行较好,可选择以某个价格在下个承包周期继续执行这些任务;车辆状况,即车辆长度和车辆吨位的乘积;运输等级,即运输任务的线路等级共分为三级;交易对象,即交易面向的司机类型共分为三类,其中B为承运商C为个体司机;路程时间,即计划到达时间与计划靠车时间之差;地区类型,即地区的类型共分为6类;需求紧急程度,即需求的紧急程度分为普通、紧急和特急三类。
通过数据预处理,得到了影响货运线路价格的11种影响因素,并且已经完成标准化处理。
(1)判断该数据是否适合进行因子分析首先运用SAS对进行标准化后的8种因素及其相关数据做KMO检验,判断该数据是否适合进行因子分析。
根据KMO的统计值发现,总体值为0.654,且大部分KMO的统计值在0.5~0.7左右,说明原变量比较适合进行因子分析。
(2)确定提取的公因子数目可根据特征值大于1和累计贡献率首次达到70%以上来判断。
经过分析研究可知,有3个特征值是大于1的,若按照特征根大于1的准则提取公因子,可以提取3个公因子;且若按累积贡献率首次达70%为准则提取公因子,也可以提取3个公因子。综上所述,提取3个公因子的效果较好。且累积贡献率高达77.19%,说明用这三个主因子解释货运线路定价已有77.19%的把握。
(3)写出旋转因子模型
旋转因子模型相比因子模型而言,可以更加直观的将多个因子分成少数的几个公因子。
经过分析可以得出11个影响因素共分为3个主因子。类型因子:业务类型、线路编码、是否续签、运输等级、交易对象和地区类型。数值因子:总里程、车辆状况和路程时间。需求因子:需求类型2和需求紧急程度。
(4)标准化得分方程:根据建立的因子模型,得到3个主因子的得分系数。从而可知每个主因子的系数,根据该系数,最终确定3个主因子的标准化得分方程。
再根据累积贡献率,我们计算得到3个主因子的权重分别为0.4264,0.3754,0.1982。由此可以得出综合得分方程为:
F=0.4264F1+0.3754F2+0.1982F3
根据主因子权重可知,F1类型主因子的权重最高,其次是F2数值主因子,最低的为F3
需求主因子。
为了判断这些因素是否能较好的反映货运线路的定价,需要计算单个影响因素的权重系数。通过主因子的得分系数和方程贡献率,计算得到11个影响因素的权重。
根据权重对11种影响因素的权重由大到小进行排序:总里程>是否续签>路程时间>车辆状况>业务类型>线路编码>需求类2>运输等级>地区类型>需求紧急程度>交易对象.由于交易对象影响因素权重只为0.0395,所占比重很小,且KMO检验值相对偏低,效果不好,所以考虑将这个影响因素剔除。最后得到影响货运线路的定价主要因素有:总里程、是否续签、路程时间、车辆状况、业务类型、线路编码、需求类型2、运输等级、地区类型和需求紧急程度共10种影响因素。
色阶颜色越浅代表变量之间的相关性越强,根据最后一列的定价Y可以直观看出与各个影响因素之间的相关关系。其中定价Y与总里程X1的相关系数高达0.99,说明总里程的数值越大,相应定价越高。同样的定价Y与车辆状况X6的相关系数高达0.92,说明车辆的吨位越重,车辆长度越长,相应定价越高。定价Y与路程时间X9的相关系数高达0.96,说明车辆的行驶时间越长,相应定价越高。
相反地,定价Y与运输等级X7的相关系数为-0.40,根据onehot编码中的一级运输编码较小为001,三级运输编码较大为100,说明运输等级中三级为低等级运输,相应的定价较低,一级为高级运输,相应定价较高。同样的,定价Y与需求紧急程度X11的相关系數为-0.10,根据onehot编码中的特急运输编码较小为001,常规运输编码较大为100,说明需求紧急程度中常规为低等级运输,相应的定价较低,特急为高级运输,相应定价较高。
参考文献:
[1]王学民.应用多元统计分析[M].上海:上海财经大学出版社,2017.
[2]胡书文,徐建武.主成分分析和因子分析在中国股票评价体系中的应用[J].重庆理工大学学报(自然科学),2017,31(05):192-202.
[3]傅依娴,芦天亮,马泽良.基于One-Hot的CNN恶意代码检测技术[J].计算机应用与软件,2020,37(01):304-308.