基于FL-TextCNN和SWE的产业链优化与产业分析平台实现

来源 :华东师范大学 | 被引量 : 1次 | 上传用户:vince_yang_666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
产业分析平台可以帮助政府掌握产业资源分布、运行状态和发展规律,在政府部门中得到了广泛的应用。产业链是产业分析平台的核心,其构建主要包括产业结构构建和企业与产业环节匹配。其中企业与产业环节匹配的前提是人工基于企业的经营范围进行行业分类。根据已有构建经验,对约5万家企业进行行业分类需花费一人一周的时间,而当地区内企业数量不断增加时,政府部门希望借助企业行业自动分类来提高产业链构建的效率。除此之外,产业链在应用层面存在的问题也日益凸显:缺少产业环节价值分析,导致政府对当地产业发展状态了解不充分,决策存在不合理性。因此,需要对产业分析平台进行优化。针对企业行业人工分类效率低下问题,本文根据企业经营范围描述文本通常较短这一特点,采用了在短文本领域分类效果较好的TextCNN深度学习方法并结合Word2vec模型,实现文本自动分类;在实际应用场景下,因不同产业的企业数量相差较大,存在样本不均衡的现象,使得模型泛化能力差。针对该问题,本文创新性地将图像领域中解决正负样本比例失衡的Focal loss方法引入文本分类领域,以提高分类模型的鲁棒性。本文基于TextCNN、Word2vec的文本自动分类模型和平衡正负样本比例的Focal loss设计了一种可以高效实现企业经营范围自动分类且鲁棒性较好的FL-TextCNN分类模型。经测试发现,该模型较常规分类模型提升16%的准确率,在实际项目中对企业行业分类结果准确率接近80%,可以快速完成分类工作,一定程度上节约了企业的人力成本。针对产业链缺少产业环节价值分析的问题,本文运用产业经济学理论,结合地区运营实际,以国家行业代码为标准,构建基于SWE(Strength and Weakness Engine)的产业环节价值分析方法,找到各条产业链的长板(Strength)、短板(Weakness)环节,根据产业链上中下游间的辐射与互动关系,发现产业瓶颈、选定优势赛道,找到可带动各条产业链发展壮大的“引擎”(Engine)。本文提出的分析方法根据链上各环节的企业集聚度、经营指标、创新能力等制定单指标SWE和多指标SWE产业环节价值评估模型对产业链进行评估,获取单个指标下的产业优势环节和综合指标下的产业长短板环节,以帮助政府调整优化产业资源。目前,根据该分析方法构建的产业链已帮助部分地区政府成功申报省“链长制”示范试点。在本文提出的基于FL-TextCNN的企业行业自动分类模型和基于SWE的产业环节价值分析方法的基础上,基于企业基础数据、企业经营数据、企业创新性数据、国民经济行业分类数据等,实现了一个产业分析平台,平台的核心功能包括:产业规模、产业集聚、产业对比、产业链。同时,平台可以通过Petal引擎定时更新产业链,形成精准度高、动态可延展的智能化产业链。优化后的产业分析平台,可以提升政府对资源配置的效率,引导产业健康、快速、有效、持续地发展。
其他文献
酒店行业在信息化的建设中不断深入,移动互联网等技术赋能酒店发展,成为网络数据生产的重要组成部分,大量类型多样的信息数据给酒店的精准市场营销提供助益。传统酒店搭上移动互联网的快车,基于大数据进行消费者洞察,创新营销方法,拉进酒店与消费者的距离。与此同时,酒店行业频繁出现大规模的个人信息泄露、违规过度索取住客个人信息等事件给酒店个人隐私信息保护带来了新的挑战,酒店业作为基础差旅设施的承担者和重要服务提
学位
“立德树人”是新时代党提出的我国教育工作的根本任务,学生会组织在践行“立德树人”方面发挥着重要作用,为学生提供了将道德认知转化道德实践的真实情景,是课堂教学的有力补充。“文化育人”是落实“立德树人”的主要途径之一,为此笔者将学生会的组织文化作为研究对象。本研究综合运用文献研究法、个案研究法、观察法、访谈法、问卷调查法和实物分析法等研究方法开展混合研究,以四川省NS高中的学生会作为个案,基于埃德加·
学位
自2014年起,全国各地陆续开始了新高考改革。浙江省作为新高考改革第一批试点省份,除考试时间、考试次数、试题形式的改变之外,最大的变革莫过于选考科目选择和高校招生制度的变化。七选三模式下学生可选的组合多达35种,学生除了考虑自身喜好外,赋分制的实施与高校专业招生要求等都是在选科时需要考虑的因素。为了解学生经过多重因素考虑后作出的选科决策是否满意,本研究对毕业后的学生展开调查。新高考改革后,高中生选
学位
近年来,城镇化进程的加快引发了一系列环境问题,如何在经济增长和生态保护之间寻求一种平衡,成为学者关注的热点。生态敏感性评价是对区域进行生态环境考察和评价的重要方法之一,而评价结果可在生态功能分区中发挥有效作用。其基本方法是对反映敏感性状态的指标因子进行赋分评价,通过各区域评价结果的差异,判定区域生态敏感性等级,对林区进行不同等级的敏感性分区。以此为基础,为区域开发利用与保护提供基本指南。本研究以神
学位
面对全国乙卷的新标准和新要求,如何提高学生的数学学习水平值得深思。在复习过程中,时常会发现反复讲反复错的问题。如何高效的利用错题,取得最大的复习效果,错题管理值得广大教师重视。因此,本研究以解析几何内容为载体,以SOLO分类理论为理论支撑,调查现有错题管理情况,研究学生所犯错误类型,分析学生的认知水平,据此提出指导学生进行科学管理错题的策略,规范错题管理形式,增强高三教学有效性,提高学生数学学习水
学位
在游戏产业发展愈发迅速的今天,越来越多的网络用户选择网络游戏作为互联网娱乐生活的重要组成部分。不仅如此,人们原有的娱乐活动场所也逐渐地从现实空间向网络虚拟空间转移。相较于现实空间具有的开放性与不确定性,当人们使用特定的软件或应用进行网络游戏活动时,其自身需求、行为目标和行为模式都是收束和被界定的,这给本文对基于用户行为的用户画像构建研究提供了基础环境。用户画像这一概念在电商、统计、搜索、社交等领域
学位
目前,正畸治疗在人们生活中的需求量越来越大。头影指标测量是正畸治疗过程中的关键步骤,通过头影指标测量可以了解患者当前的面部形态。传统的测量方法是通过专家医生进行手动标注头影标志点进行的,需要医生与相关技术人员投入大量的时间和精力。本文利用深度卷积神经网络方法进行头影标志点检测,并提出了一个自动化检测头影标志点、识别牙冠、制定治疗计划的系统。具体工作如下:(1)研究了头部骨骼X-ray射线图像标志点
学位
集团化办学已经成为推进义务教育优质均衡发展的重要举措。在政府的大力推动和支持下,全国各地掀起了一阵集团化办学的热潮,出现了多个公办和民办的教育集团,而且已经出现了由区域内的集团化办学走向异地多校区集团化办学的趋势和倾向。然而,以往学界对于集团化办学的研究仍集中于区域内的探索和实践。本研究尝试以Y民办教育集团作为研究对象,对处于起步阶段的异地多校区集团化办学问题进行研究,无疑具有较强的现实意义和一定
学位
位于成都北部的繁江书院(今属成都市新都区新繁镇)是新繁县的官修书院。该书院自清乾隆二十九年(1764年)创建伊始,便承担着地方教化、学术研究的重要功能。以官、绅、民为主体的社群在书院的文化建设中发挥着三位一体的重要作用,共同构筑了新繁县的文化与学术生态。随着书院内部人员、政策、资金等要素的变动,新繁县的学术文化生态也因之发生变化。繁江书院作为新繁的治学教化之所,其文化对今天新繁的中学教育具有重要的
学位
全氟辛烷磺酸(Peifluorooctane sulfonate,PFOS)是曾在世界广泛使用的一种全氟化合物(Perfluorinated compounds,PFCs),在自然环境中的水体、土壤以及生物体包括人类组织中都被检测到,已成为公认的持久性有机污染物(Persistent Organic Pollutants,POPs)。已有研究表明,PFOS的暴露能够引起神经毒性、发育与生殖毒性以及
学位