论文部分内容阅读
摘 要:在已有的制造业产业转移研究中,较少考虑待转移企业在产业转移过程中的选择主动性,构建特征集合时一般企业历史、企业类型等定性特征,较少考虑企业经营状况、资产规模、盈利能力和发展前景等定量特征。本文创造性的以汽车制造业企业的财务特征为主要数据来源,引入地域产业承载系统适配性理论,使用随机随机森林分类算法对86家中国上市公司中汽车制造业企业适合哪种类型的地域产业承载系统适配性区域做出预测,结果表明使用财务数据能够较好的预测企业的产业转移适配区域。
关键词:财务数据 产业转移 适配区域选择 产业承载系统适配性
一、引言
产业转移就是企业寻找与之相适配的地域产业承载系统的再区位过程,是企业竞争和技术转移的结果。目前相关的研究主要集中在区域的产业承载系统适配性方面,强调区域在产业转移过程中的承接作用,较少考虑待转移企业在产业转移过程中的选择主动性(产业转移是一个双向选择过程),且在考虑区域适配性时一般只考虑到行业层次,较少考虑行业内企业之间的差异。杨本建等在观察产业转移政策的效果后认为,产业转移政策对异质性的企业具有選择效应,这说明从企业视角对产业转移的适配区域进行研究具有一定的理论意义和应用价值。本文从企业角度出发,基于企业财务特征数据,对汽车制造业企业的产业转移展开定量分析研究,对已有研究形成补充。
二、研究思路
本文的基本思路是,首先引入地域产业承载系统适配性理论及相应的适配度计算方法,计算各待选区域的适配性等级,并引入财务特征等给出各待转移企业的量化特征集,然后以企业作为研究对象,将企业与待转移区域间的适配问题抽象为具有不同特征的企业是否适合某种类型区域的分类问题,将是否适合转移到某类区域(根据地域适配性等级划分)作为目标变量,将以财务数据为主提取企业特征变量,然后使用合理的机器学习方法(如随机森林)构建分类器对企业适合哪种类型的地域产业承载系统适配性区域进行预测,实现科学有效的适配区域选择。
但具有产业转移意向的待转移企业是千差万别的,哪些特征会影响其转移行为,即企业转移行为的差异是由哪些特征的差异所引起的,由于影响产业转移的因素多种多样,相互关系复杂多变,但万变不离其宗,企业找适配区域类似女生找婆家,既要“两情相悦”,还要“门当户对”,所以在构建特征集合时既需要考虑企业历史、企业类型等定性特征,也需要考虑企业经营状况、资产规模、盈利能力和发展前景等定量特征。
另一方面,近年来,随着财务报表分析方法的发展,逐渐的发展出一个用于表示企业经营状况、盈利能力、发展水平等的多级指标体系,并形成了以国泰安的CSMAR数据库为代表的一批标准数据提供者。考虑到方法的实用性和数据的规范性、标准性及易于提取,用于适配区域选择的企业特征集应该可以采用以财务特征为企业定量特征的主要来源,兼顾部分重要的企业定性特征定量化的方式来构建。为此本文提出的以企业财务特征为主要来源的量化特征集如图1所示。
三、收据收集与整理
以机械制造业中的汽车制造业上市公司(代码为C36)为例,通过实例给出本文方法的应用过程和应用效果,选取汽车制造业是因为汽车制造业的产业转移过程相对比较明确,且代表性广泛,既有从沿海向中西部的转移,也有中西部企业向东部省份的转移。
至2015年9月10日,共得到86个企业样本数据。其中通过CSMAR数据库获取了2014年第3季度的财务数据,结合本文方法的特点,对原始数据进行了筛选和提炼,最终保留了8个大类的159个指标,囿于篇幅,这里只列出了每类1个代表指标的描述统计信息(如表1),详细的全部指标说明和计算方法可参考CSMAR数据库的有关说明文档。
刘友金等在产业转移理论的基础上提出制造业转移与地域产业承载系统适配性概念,本文沿用该成果,依据经济基础、产业配套等6类共19个指标来描述地域的产业承载系统适配性,对各省级区域的产业承载系统适配状况进行分析,得到2006年到2013年个省的地域产业承载系统协调适配度数值及8年的平均值,并将中国31个省、市、自治区的协调适配划分为5个等级。目标变量和其它特征数据是通过人工和web爬虫分析相关企业的官方网站、新闻资料等来有效获取的,共获得的比较完整的86个企业的数据,表2为节略的18个代表企业的数据。然后再根据转移省份类型衍生出目标变量,结合本例实际按是否不转移、转移到1级、2级、1或2级、3级、4或5级共6个变量,分别记为T1L,T6。
四、结果与讨论
使用R语言(R3.2)的randomForest包提供的randomForest()函数和predict()函数分别进行训练和预测,得到模型参数和 预测结果。分别采用3折不重复抽样方法将样本分为训练集和测试集,根据上述函数可以计算得到预测值。取三分之一作为测试集(29个样本),其余作为训练集,使用随机森林算法将上述训练和预测过程独立运行100次,记录准确率和召回率的平均值、最小值和最大值,所的结果汇总如表3。从表3不难看出,准确率的平均值全部大于0.5,召回率在T4和T5两个变量上的均值也大于0.5,而在T2,T3和T6上预测效果不佳可能是因为样本数较少,代表性不够,比如将转移到1类和2类地区合并成T4以后召回率就有显著提高。上述结果表明,本文的模型有效,方法可行,具有很强的理论意义和较强的应用价值。
五、结语
本文针对汽车制造业在产业转移过程中如何科学合理的选择迁徙适配区域这一关键问题,从企业视角出发,以企业财务指标为主要来源构建企业特征指标体系,获取实际数据,使用R语言实现随机森林分类算法对数据进行处理,结果表明使用财务数据能够较好的预测企业的产业转移适配区域。本文还存在诸多不足和有待进一步研究的地方。比如:(1)本文所提出的企业特征集的构建方法仍以定性分析为主,后续可在特征选择和优化时引入了定量。(2)文是以省份为适配区域的粒度单位,后续可以进一步细化到城市粒度。 参考文献:
[1] Florida R,Kenney M. Transplanted organizations: The transfer of Japanese industrial organization to the US[J]. American Sociological Review, 1991: 381-398.
[2] Albino V,Garavelli AC,Schiuma G. Knowledge transfer and inter-firm relationships in industrial districts: the role of the leader firm[J]. Technovation, 1998, 19(1): 53-63.
[3] Graimann B. Industrial Perspectives on Innovation within Neurorehabilitation between Private and Public Partners[M]//Replace, Repair, Restore, Relieve–Bridging Clinical and Engineering Solutions in Neurorehabilitation: Springer, 2014: 879-879.
[4] 刘友金,吕政. 梯度陷阱, 升级阻滞与承接产业转移模式创新[J]. 经济学动态, 2012, (11).
[5] 刘友金,冯晓玲. 制造业成长与地域产业承载系统适配性及空间差异[J]. 系统工程, 2013, 31(010): 34-42.
[6] 刘惠敏. 长江三角洲城市群综合承载力的时空分异研究[J]. 中国软科学, 2011, (10): 114-122.
[7] 闫安,赵淑琪,裴凤. 皖北地区产业转移综合承接能力评价[J]. 合肥工业大学学报: 社会科学版, 2012, 26(2): 18-26.
[8] 楊本建,毛艳华. 产业转移政策与企业迁移行为——基于广东产业转移的调查数据[J]. 南方经济, 2014, 32: 1-20.
[9] Learning M. Machine Learning[M]: McGraw-Hill Science/Engineering/Mat, 1997.
[10] Ho TK. Random decision forests[C]. Proceedings of Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, Que. , 1995: 278 - 282.
[11] Ho TK. The Random Subspace Method for Constructing Decision Forests[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, 20(8): 832–844.
[12] Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1): 5-32.
[13] 冯晓玲. 制造业转移与地域产业承载系统适配性研究 [D]: 湖南科技大学, 2014.
[14] R-Core-Team. R: A language and environment for statistical computing [EB/OL]. (2015-10-7).. http://www.R-project.org/.
[15] "Mahout". Absolute Elephant Information Encyclopedia [EB/OL]. (2016-01-28). http://www.elephant.se/mahout.php.
作者简介:杨琴(1986—),女,海南万宁,汉,湖南科技大学2013级工商管理专业硕士研究生,湖南科技大学商学院。
关键词:财务数据 产业转移 适配区域选择 产业承载系统适配性
一、引言
产业转移就是企业寻找与之相适配的地域产业承载系统的再区位过程,是企业竞争和技术转移的结果。目前相关的研究主要集中在区域的产业承载系统适配性方面,强调区域在产业转移过程中的承接作用,较少考虑待转移企业在产业转移过程中的选择主动性(产业转移是一个双向选择过程),且在考虑区域适配性时一般只考虑到行业层次,较少考虑行业内企业之间的差异。杨本建等在观察产业转移政策的效果后认为,产业转移政策对异质性的企业具有選择效应,这说明从企业视角对产业转移的适配区域进行研究具有一定的理论意义和应用价值。本文从企业角度出发,基于企业财务特征数据,对汽车制造业企业的产业转移展开定量分析研究,对已有研究形成补充。
二、研究思路
本文的基本思路是,首先引入地域产业承载系统适配性理论及相应的适配度计算方法,计算各待选区域的适配性等级,并引入财务特征等给出各待转移企业的量化特征集,然后以企业作为研究对象,将企业与待转移区域间的适配问题抽象为具有不同特征的企业是否适合某种类型区域的分类问题,将是否适合转移到某类区域(根据地域适配性等级划分)作为目标变量,将以财务数据为主提取企业特征变量,然后使用合理的机器学习方法(如随机森林)构建分类器对企业适合哪种类型的地域产业承载系统适配性区域进行预测,实现科学有效的适配区域选择。
但具有产业转移意向的待转移企业是千差万别的,哪些特征会影响其转移行为,即企业转移行为的差异是由哪些特征的差异所引起的,由于影响产业转移的因素多种多样,相互关系复杂多变,但万变不离其宗,企业找适配区域类似女生找婆家,既要“两情相悦”,还要“门当户对”,所以在构建特征集合时既需要考虑企业历史、企业类型等定性特征,也需要考虑企业经营状况、资产规模、盈利能力和发展前景等定量特征。
另一方面,近年来,随着财务报表分析方法的发展,逐渐的发展出一个用于表示企业经营状况、盈利能力、发展水平等的多级指标体系,并形成了以国泰安的CSMAR数据库为代表的一批标准数据提供者。考虑到方法的实用性和数据的规范性、标准性及易于提取,用于适配区域选择的企业特征集应该可以采用以财务特征为企业定量特征的主要来源,兼顾部分重要的企业定性特征定量化的方式来构建。为此本文提出的以企业财务特征为主要来源的量化特征集如图1所示。
三、收据收集与整理
以机械制造业中的汽车制造业上市公司(代码为C36)为例,通过实例给出本文方法的应用过程和应用效果,选取汽车制造业是因为汽车制造业的产业转移过程相对比较明确,且代表性广泛,既有从沿海向中西部的转移,也有中西部企业向东部省份的转移。
至2015年9月10日,共得到86个企业样本数据。其中通过CSMAR数据库获取了2014年第3季度的财务数据,结合本文方法的特点,对原始数据进行了筛选和提炼,最终保留了8个大类的159个指标,囿于篇幅,这里只列出了每类1个代表指标的描述统计信息(如表1),详细的全部指标说明和计算方法可参考CSMAR数据库的有关说明文档。
刘友金等在产业转移理论的基础上提出制造业转移与地域产业承载系统适配性概念,本文沿用该成果,依据经济基础、产业配套等6类共19个指标来描述地域的产业承载系统适配性,对各省级区域的产业承载系统适配状况进行分析,得到2006年到2013年个省的地域产业承载系统协调适配度数值及8年的平均值,并将中国31个省、市、自治区的协调适配划分为5个等级。目标变量和其它特征数据是通过人工和web爬虫分析相关企业的官方网站、新闻资料等来有效获取的,共获得的比较完整的86个企业的数据,表2为节略的18个代表企业的数据。然后再根据转移省份类型衍生出目标变量,结合本例实际按是否不转移、转移到1级、2级、1或2级、3级、4或5级共6个变量,分别记为T1L,T6。
四、结果与讨论
使用R语言(R3.2)的randomForest包提供的randomForest()函数和predict()函数分别进行训练和预测,得到模型参数和 预测结果。分别采用3折不重复抽样方法将样本分为训练集和测试集,根据上述函数可以计算得到预测值。取三分之一作为测试集(29个样本),其余作为训练集,使用随机森林算法将上述训练和预测过程独立运行100次,记录准确率和召回率的平均值、最小值和最大值,所的结果汇总如表3。从表3不难看出,准确率的平均值全部大于0.5,召回率在T4和T5两个变量上的均值也大于0.5,而在T2,T3和T6上预测效果不佳可能是因为样本数较少,代表性不够,比如将转移到1类和2类地区合并成T4以后召回率就有显著提高。上述结果表明,本文的模型有效,方法可行,具有很强的理论意义和较强的应用价值。
五、结语
本文针对汽车制造业在产业转移过程中如何科学合理的选择迁徙适配区域这一关键问题,从企业视角出发,以企业财务指标为主要来源构建企业特征指标体系,获取实际数据,使用R语言实现随机森林分类算法对数据进行处理,结果表明使用财务数据能够较好的预测企业的产业转移适配区域。本文还存在诸多不足和有待进一步研究的地方。比如:(1)本文所提出的企业特征集的构建方法仍以定性分析为主,后续可在特征选择和优化时引入了定量。(2)文是以省份为适配区域的粒度单位,后续可以进一步细化到城市粒度。 参考文献:
[1] Florida R,Kenney M. Transplanted organizations: The transfer of Japanese industrial organization to the US[J]. American Sociological Review, 1991: 381-398.
[2] Albino V,Garavelli AC,Schiuma G. Knowledge transfer and inter-firm relationships in industrial districts: the role of the leader firm[J]. Technovation, 1998, 19(1): 53-63.
[3] Graimann B. Industrial Perspectives on Innovation within Neurorehabilitation between Private and Public Partners[M]//Replace, Repair, Restore, Relieve–Bridging Clinical and Engineering Solutions in Neurorehabilitation: Springer, 2014: 879-879.
[4] 刘友金,吕政. 梯度陷阱, 升级阻滞与承接产业转移模式创新[J]. 经济学动态, 2012, (11).
[5] 刘友金,冯晓玲. 制造业成长与地域产业承载系统适配性及空间差异[J]. 系统工程, 2013, 31(010): 34-42.
[6] 刘惠敏. 长江三角洲城市群综合承载力的时空分异研究[J]. 中国软科学, 2011, (10): 114-122.
[7] 闫安,赵淑琪,裴凤. 皖北地区产业转移综合承接能力评价[J]. 合肥工业大学学报: 社会科学版, 2012, 26(2): 18-26.
[8] 楊本建,毛艳华. 产业转移政策与企业迁移行为——基于广东产业转移的调查数据[J]. 南方经济, 2014, 32: 1-20.
[9] Learning M. Machine Learning[M]: McGraw-Hill Science/Engineering/Mat, 1997.
[10] Ho TK. Random decision forests[C]. Proceedings of Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, Que. , 1995: 278 - 282.
[11] Ho TK. The Random Subspace Method for Constructing Decision Forests[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, 20(8): 832–844.
[12] Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1): 5-32.
[13] 冯晓玲. 制造业转移与地域产业承载系统适配性研究 [D]: 湖南科技大学, 2014.
[14] R-Core-Team. R: A language and environment for statistical computing [EB/OL]. (2015-10-7).. http://www.R-project.org/.
[15] "Mahout". Absolute Elephant Information Encyclopedia [EB/OL]. (2016-01-28). http://www.elephant.se/mahout.php.
作者简介:杨琴(1986—),女,海南万宁,汉,湖南科技大学2013级工商管理专业硕士研究生,湖南科技大学商学院。