基于fastText算法的行业分类技术

来源 :北京航空航天大学学报 | 被引量 : 0次 | 上传用户:spring2011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础.根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型.首先,构建行业分类关键词库,通过特征词库进行分词和权重计算.然后,构建分类器模型,实现中文行业的自动分类.最后,实验选取了80000个包含企业经营范围、企业信息、舆论信息的测试文档,结果表明,所提模型结果高于Bayes、决策树、KN N等分类算法,取得了较好的应用效果.
其他文献
为了解高校突发火灾时人员疏散行为及心理,在参照其他人员密集场所应急疏散调查问卷的基础上,设计大学生疏散行为及心理特征调查问卷,并进行网络问卷调查.采用皮尔森卡方检验对应急个体特性、应急意识、应急经验、应急疏散条件与应急疏散心理及行为反应进行相关性分析,获取11组存在显著相关变量组.结果表明:男生在突发火灾时更冷静、自主,更愿意帮助他人;应急疏散心理及行为与消防安全关注程度、应急疏散设施及环境呈明显的正相关.因此可通过加强宣传教育、开展专业的消防教育及演练、完善疏散引导设施、增强安全出口的导向性等提高学生的
为系统分析矿工在机电运输过程中产生不安全行为的关联因素,降低事故发生概率,本文从煤矿安全生产网和应急管理部公布的煤矿事故案例中选取2015-2021年发生的90起机电运输事故作为案例样本,统计分析煤矿机电运输中不安全行为在动作分类、班次、月份、地点和岗位5个维度的分布特征;运用Apriori算法研究煤矿机电运输事故这5个维度之间存在的关联规则.研究表明:在3个班次中,中班时间段出现的不安全行为比率最高;在一年中8月份出现的不安全行为最多;处于工作面中的不安全行为出现最多;一线工人的不安全行为出现最多.重点
为降低固引剂碎片伤害事件发生的概率,首先研究爆竹固引剂碎片致害机理,并采用风险矩阵法构建固引剂碎片风险评估方法;然后对200批次爆竹产品固引剂的质量安全进行风险监测预警;最后对固引剂组份及配比进行技术改良并实践验证.研究表明:爆竹固引剂碎片风险值为9,风险等级为中风险,属于大概率风险事件,风险程度为“严重级”.改良后的固引剂各项技术指标全部符合质量安全要求.
《安全系统工程》教材高质量编写和出版对高级安全人才的安全系统理论与实践水平的培养具有重要意义.本文首先对国内30多年来出版的《安全系统工程》教材内容进行分析,评述现有《安全系统工程》教材存在的问题和不足,并提出建议对策;然后,从安全系统工程的基础术语和《安全系统工程》新教材的提纲2方面对新教材的编写提出展望.研究表明:安全系统工程新教材编写需要充分体现系统工程思想及其基础理论、内容需要不断更新并与国际接轨,这样的教材才能对安全系统工程的教学和科研更具参考价值.
为研究液氯槽罐车在道路运输过程中,罐体泄漏孔高度对液氯泄漏扩散过程的影响,本文基于计算流体力学软件Fluent,建立不同高度泄漏孔对应的罐体气相、液相空间泄漏的理论模型,计算不同泄漏模型的泄漏量,研究不同风向、风速、泄漏孔径对氯气泄漏扩散过程的影响.结果表明:风向对2种泄漏模式的扩散范围影响不显著;风速较小时,气相空间泄漏的致命范围大于液相泄漏;风速较大时,液相空间泄漏的致命范围远远大于气相空间;同时,两者受风速的影响具有相似点,风速越大泄漏扩散相对稳定后的氯气浓度值越低;气相、液相泄漏模式的致命范围均随
为减少煤改气村户内天然气事故的发生,应用检查表对北京54个行政村1956户煤改气村用户户内燃气设施进行现场检查,对存在的安全隐患进行梳理,从工程、管理、用户3方面分析安全隐患产生原因,并提出保障煤改气村天然气安全使用对策措施.研究表明:壁挂炉间堆放可燃杂物、燃气管道及壁挂炉与电气设备间距不足、燃气管道穿墙未封堵等是其主要安全隐患;从设置专职安全运行员、设置网格综合服务站等5个方面提出对策措施.
为研究食品生产企业员工安全行为的影响因素,本文基于安全领导力、安全氛围、个体认知等方面对员工安全行为的重要影响作用,研究上述各维度对安全行为的影响,结果表明:可感知的安全领导力、良好的安全氛围及对安全的个体认知情况,均会促进员工主动安全行为的产生,且安全领导力对安全行为的影响作用最大,其次是个体认知,再次是安全氛围;安全氛围会抑制员工安全道德行为的产生,个体认知会抑制员工自律守纪行为的产生.
为提高居民自身的安全素养,本文首先采用文献研究的方法,基于WSR理论初步建立社区居民安全素养评价指标体系;然后通过专家访谈采用G1法确定指标主观权重,通过调研问卷采用熵权法确定指标客观权重,之后使用方差最大化方法确定主客观组合权重,进而建立起居民安全素养综合评价指标模型,并获得各指标重要性排序;最后使用所建立的评价模型对某一老旧小区进行案例应用,获得该老旧社区居民安全素养评分为0.71,居民安全素养等级为中等.结果表明,本文所建立的指标体系可用于社区居民安全素养的评价,为社区进一步提升居民安全能力提供参考
为解决传统油田钻修井作业安全监测方法在实际应用中存在监测定位误差较大,无法保证作业人员安全的问题,本文开展基于UWB定位技术的油田钻修井作业安全监测方法研究,通过油田井下液位数据采集、基于UWB定位技术的钻修井安全作业节点定位、划分钻修井作业安全监控动态预警范围,提出一种全新的监测方法,并进行对比实验.结果表明:新的监测方法能够有效减小监测定位误差,为作业人员安全提供保障,提高油田企业经济效益和社会效益.
为提升钢桥梁施工项目安全管理水平,本文采用人员访谈、问卷调研及逻辑分析的方法,对钢桥梁施工项目关键问题进行界定,并建立施工项目关键问题的双循环系统;在此基础上,从施工项目内循环、外循环方面对项目主体系统提出组合干预策略.研究表明:施工项目主体系统主要受内外双循环系统的要素作用,其中内循环分别为生产系统、技术系统、配置系统、安监系统,具有相互作用机制,外循环系统通过系统管理合作面、服务监督面、沟通协调面3个工作面作用,相互之间具有17个作用要素.