基于Boosting族算法的企业价值评估——以中国独角兽企业为例

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:ymqlove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自2013年Aileen Lee首提“独角兽”概念,到2014年2月习近平总书记在关于网络安全的会议上讲到,“我国正处在信息化和经济全球化相互促进的浪潮中”,但是存在“自主创新方面相对落后”的问题,2015年李克强总理在《政府工作报告》中制订“互联网+”行动计划,再至2018年,科技部正式规范“独角兽企业”的判定标准。短短六七年的时间,我国独角兽企业获得了跃升式的发展,企业规模和数量都大幅提升,企业数量从2016年131家翻升至2020年底的251家,逐步成为中国新的经济增长点。独角兽企业是指发展迅猛,成立不足10年,却估值超过10亿美元的一类未上市企业,是中国新经济时期下的新支柱,是登上“信息化、创新化”快车的代表。与传统企业相比,它具有无形资产占比重、产业下沉速度快、革新力度大等特点。然而,独角兽的快速发展也伴随着层出不穷的问题阻碍其发展。比如产品同质性高、市场热度持续性低、企业价值波动幅度大等情况,所以,对独角兽企业做出准确的识别及其价值的合理评价有着关键意义。而常见的会计评估价值方法流程复杂、时效性差,跟不上独角兽的变动速度,不利于吸引资本市场和投资者加盟。本文总体目的是将机器学习方法应用于独角兽企业的价值评估上。本文基于天眼查、国家知识产权官方网站等平台收集中国独角兽企业基础信息和经营数据,构建了中国独角兽企业评估的多维度变量。从“静态属性”“动态属性”2个大方面进行维度分解,梳理出静态属性由“基本信息”、“所处环境”2个维度构成;动态属性由6个维度构成:“市场情绪”、“创新能力”、“融资情况”、“负面信息”、“竞争压力”、“发展潜力”,共19个基本指标。然后根据《中国独角兽企业研究报告2021》上全量企业榜单合理地分为4类,建立XGBoost、Light GBM、Cat Boost和Stacking4种分级评估模型。本文选择上述4种算法作为研究工具的主要原因有三个:第一,在独角兽价值评估变量众多的情况下,通过人工处理很难准确预测,而Boosting族算法可以自动迭代实现价值预测。第二,本文研究的数据是高维小样本数据。深度学习模型需要大量的训练数据,因此,擅长处理高维数据的Boosting集成算法与本文的研究非常吻合。第三,Light GBM、Cat Boost算法是目前最前沿的方法。在之前的基础上,提高了计算机的预测精度和计算效率,降低了过拟合的可能性。最终结果上,这4种模型的整体表现比较接近,其中单一模型中Light GBM训练速度最快且准确率最高;Stacking融合模型表现最好,准确率达84.8%。此外,分析特征重要性排名图可以得出,融资金额、专利数、百度指数、竞品数量是模型中的重要指标。因此,可将基于具体指标的创新能力与融资能力的数据视为是独角兽企业评估的关键点。
其他文献
近年来随着我国计算机技术的高速发展以及互联网行业的崛起,对传统银行业带来了较大冲击,促使银行业进行数字化转型,而金融科技是其内部转型的重要动力之一,也成为决定各家银行在金融市场中竞争力水平的重要因素。目前各家银行纷纷开始角逐金融科技赛道,希望能够减少用户向互联网企业的流失,加快自身内部IT架构转型,拓宽业务渠道,推出新型数字化金融产品。因此如何确立正确的金融科技发展方向达到提高服务质量和运营效率的
学位
事件抽取是信息抽取三大任务之一,通过将文本中事件的信息识别出来,并且把非结构化文本的事件信息用统一结构集成呈现出来,可有效地从海量的非结构化文本数据中获取关键信息,其模型效果的好坏会影响到知识图谱、实体抽取、关系抽取等下游自然语言任务的性能。目前,对于商品新闻领域的事件抽取研究较少,为促进这一领域的发展,本文主要是基于CNC数据集来展开事件抽取模型的研究。本文旨在探究事件检测和论元识别两个事件抽取
学位
随着互联网与信息技术的迅猛发展,传统的信息传播媒介已无法满足人们对于即时信息的需求,依托网络的新媒体迎来了春天,在微博平台上,网民只需手指一划便可得到第一手资讯。然而,网络社交媒体平台很有可能成为虚假新闻滋生的温床,阻碍真实信息的传播,还有可能导致民众对当局政府的不信任,造成社会动荡。如何迅速有效地检测出社交平台上的虚假新闻,成为消除新闻误导、净化网络环境的重中之重。本文从新媒体社交平台入手,以微
学位
随着科学技术的飞速发展,数字科技产业也呈现一片欣欣向荣之态,人类已经进入数字化时代。在政企不懈努力和相关政策倾斜加持下,我国数字经济进一步发展,在国际上已经具备一定的竞争优势以及发展潜力。但数字经济发展不均衡不充分的问题也随之而来。因此,我们需要在关注数字经济发展速度的同时,关注数字经济发展质量。当前,数字经济成为诸多学者的关注课题,但从八大经济区的视角深入研究,探索其发展差异及趋势的文献相对较少
学位
党的十九大强调,我国当前的经济发展模式需要转型,在保持增速的同时也要保证质量,经济发展的重心已经转变为追求高质量的发展,海洋是陆域的延伸,也应该承担起高质量发展的重任。海洋经济从追求速度规模到追求质量效率的转变,可以增强我国的国际竞争力,在竞争越来越激烈的国际环境中脱颖而出。所以,科学、全面、准确地评价各地海洋经济高质量发展水平,是实现海洋经济高质量发展的前提,也能够在政府制定相关政策时提供依据。
学位
中国在最近的四十年里创造了经济快速发展的奇迹,令世界瞩目,但与此同时带来的是资源日益枯竭、环境严重污染等问题。为了实现经济与环境共同发展,我国必须实现经济发展模式的转变,为了建设生态文明的国家,我们应当在保证经济增长的同时,降低我国的能源消耗,这要求我们提升我国的能源效率。此外,我国地势多样、幅员辽阔,不同地区之间在经济发展、地理环境等方面存在着巨大的差异。因此,在提升我国的能源效率时,我们需要具
学位
新冠肺炎疫情是百年一遇的健康危机,导致大量人口不幸感染、罹难,造成了严重的经济破坏。虽然现阶段我国新冠肺炎疫情已基本得到控制,但疫情对经济与房地产市场的冲击已经产生,并仍在持续影响人们的生活,且疫情的局部性反复与散点式爆发一直在冲击影响着房地产市场的稳定。本文基于从链家网爬取的武汉市微观房产交易数据,使用因果推断和事件效应评估中常用的合成控制法(SCM)和双重差分法(DID),从微观视角评估了20
学位
贫困是全球共同面临的困难,也是伴随着社会经济发展一直存在的问题,我国在2020年底完成了消除绝对贫困的艰巨任务,因此贫困的性质和特点也发生了相应的变化。我国贫困问题已由原来绝对贫困的研究转向现在对相对贫困的探讨,从单一收入维度识别贫困群体转为从多维度视角综合评价。农村地区依然是贫困的主要发生地区,虽然绝对贫困已消除,但是却存在更加复杂更难解决的贫困问题,因此本文基于农村地区进行贫困问题研究。同时,
学位
金融市场的变化莫测,人们很难完全知晓其中的特征波动规律,因此通过分析高频金融数据反映市场波动的特征规律是十分准确和有必要的。高频金融数据是指在开盘期间进行高频抽样所计算得到的金融交易数据,高频金融数据的研究能够更为细致和全面的准确反映和计算出当前各种金融产品在金融市场上的波动,通过高频金融数据的波动分析,能够更好的帮助于人们更准确的规避当前各种金融产品的波动对于投资者收益所带来的影响和风险,有利于
学位
数字经济的发展将成为经济高质量发展的重要增长点,为全球经济发展注入新的活力。自2017年以来,党和国家对数字经济的发展给予了充分重视,各地数字经济发展水平的提高也取得了显著成效,但数字经济仍存在非均衡发展问题。因此,关注我国数字经济发展时空特征,探索影响数字经济发展水平的因素,对于缩小我国地区数字鸿沟及促进数字经济发展具有极其重要的现实意义。本文以2015-2019年我国31个省级行政区的数字经济
学位