基于深度学习的建筑安全检查纪要文本挖掘研究

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:xb_wonder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建筑施工安全生产过程中积累了大量安全检查纪要、专项安全检查报告和安全事故报告等相关数据,这些数据中隐含着安全隐患和安全事故的重要信息。利用深度学习模型对安全检查纪要文本中的数据进行提取并对进行文本挖掘,可以挖掘出安全隐患的空间分布规律、时间分布规律和强关联规则等信息,这些信息对建筑施工安全管理具有重要的意义。但是用深度学习模型对安全检查纪要进行文本挖掘时,面临着数据集规模小、样本数据分布不均衡、安全隐患类型信息不存在实体等问题。针对上述问题,本文对安全检查纪要进行文本挖掘的主要工作分为三个部分:1、首先,利用基于数据增强的命名实体识别模型对文本数据中安全隐患出现的时间、地点和所属部门等实体进行提取。在该部分,本文提出了一种基于数据增强的命名实体识别模型。该模型不仅实现了扩充数据的自动标注,而且解决了数据增强方法对命名实体造成破坏的问题和样本数据分布不均衡的问题;最终,该模型通过进一步的噪声数据优化和比例参数优化,使模型在一倍扩充数据上的F1值从92.83%提升至97.23%。2、其次,利用基于数据增强的文本分类模型对安全隐患类型信息进行提取。在该部分,本文提出了一种基于数据增强的文本分类模型。该模型利用命名实体分离后的数据,对非命名实体部分进行随机替换操作,使安全检查纪要文本中各类安全隐患问题分布更加均衡;然后,该模型通过噪声数据和比例参数优化进一步提高文本分类效果,使模型在三倍扩充数据上的F1值从86.93%提升至95.92%。3、最后,利用关联算法和可视化工具对提取出的数据进行处理。首先对深度学习模型提取出的数据进行处理,然后利用关联算法和数据可视化工具将提取出的信息和关联规则以直观的方式展现出来,最后对安全隐患问题在时空上的分布规律和关联规则进行分析。结果表明,这些可视化后的数据和强关联规则对安全管理和生产活动具有一定的指导意义,可以使安全管理措施更有针对性,从而提高安全管理的效率。
其他文献
随着科技的不断发展,各个行业领域所积累的数据信息与日俱增,不平衡数据问题无处不在,相关分类问题已成为数据挖掘领域的一个研究热点。针对不平衡数据分类问题的研究主要分为数据层面和算法层面两个角度,本文将从上述两个角度展开研究工作。本文首先将合成少数类过采样技术(SMOTE)与支持向量机(SVM)结合,形成SMOTE-SVM算法。将该算法在UCI数据集和实际工业数据集中进行试验,分析其在数据生成与分类上
学位
磁共振成像(MRI)是目前医学领域内普遍采用的一种影像技术,其基本原理是核磁共振,即人体(处于强磁场中)中的氢原子核被特定频率的射频脉冲激励而产生共振,向外辐射射频信号,这个回波信号被采集,并通过特定的方式重建以得到人体图像。传统上MRI的射频回波信号是通过同轴电缆从屏蔽室的低噪前置放大器传送到设备室的谱仪进行采集,这种情况下模拟信号的传送必然存在一定的衰减,并且容易受到干扰。因此,为了改善MRI
学位
血浆是最可靠、最方便的疾病诊断生物标志物来源,广泛用于即时诊断。然而,在进一步分析生物标志物之前,需要从血液中提取血浆,血浆的提取是许多临床测试的先决条件。血浆中含有多种蛋白质标志物,因此检测血浆中的蛋白质是最直观可靠的。使用微流体技术可以显著降低分析成本,并使分析设备小型化,使生物样本分析过程变得更加简单。介电泳技术是一种主动分离法,和离心、过滤等传统方法相比该技术操作简单,生物危害少。介电泳在
学位
理论研究与工程实践表明,模型预测控制面向处理复杂化工过程的非线性、大时滞等特性是一种有效的方法。然而,其预测模型的建立通常需要进行现场的在线测试、而影响正常生产;另外,化工过程由于受到原料状况以及调度策略的改变、产生多种操作工况,这会使得单一工况的预测模型出现较大偏差,从而降低模型预测控制的性能。针对以上问题,论文研究了一种基于数据深度学习的化工过程多工况模型预测控制方法(MC-MPC),所完成的
学位
在传统石油、化工等一些复杂工业过程的优化控制中,针对工业实际需求,人们一直致力于生产质量、生产效率及自动化的发展。在解决像操纵变量决策优化等复杂问题时,通常受到模型不确定及大时滞的影响。基于最优控制理论方法的提出及其应用,推动了工程控制领域的发展。但是这些方法往往依赖专家经验驱动决策方向,容易受模型失配和维度灾难问题的制约,由于时延问题导致的策略实时优化难以实现。针对以上问题,本文提出了一种基于目
学位
广袤的海洋蕴藏着丰富的资源,船舶业飞速发展,各类船舰在海洋中长期航行,会导致海洋生物长期附着在船舶表面,从而大大增加船舶阻力,降低船舶行驶速度,增加油耗,缩短船舶服务寿命,因此船体表面附着物的清洗是实现船舶节能减排的重要途径之一。我国针对船体的清洗技术仍落后于发达国家,尚不能满足国内船舶市场需求。研发自动化程度高的船体清洗机器人,具有重要意义。本文结合船体清刷ROV(Remote Operated
学位
近年来科技发展迅速,移动机器人的应用更加多元,而实现其在工业和生活更深维度应用的一个重要前提是定位与对于环境的感知建图,SLAM技术作为实现移动机器人定位建图的关键成为研究热点。本文研究了RGB-D相机和IMU传感器融合的SLAM方案,只是视觉SLAM虽能够实现定位与建图,却不能实现场景中语义信息的提取,场景中的语义信息可以通过基于卷积神经网络(CNN)的语义提取算法提取。因此总体来说,本文采用视
学位
给水管网是一个城市中不可缺少的基础设施,是城市居民生活和工业生产的生命线工程。随着人口的逐年增长以及城市的扩张,城市用水需求持续增加,城市现存的老旧给水管网不能满足城市用水需求,使得城市给水管网改扩建工程十分必要。科学合理的给水管网设计方案不仅能够节省管网建设成本和运行维修费用,还可以增加供水系统的可靠性。本文通过研究给水管网的优化设计,设计了给水管网优化模型,提出了一种改进麻雀搜索算法,对给水管
学位
流程工业的规模发展越来越大,有效建立过程模型对于生产过程优化控制有重要意义。当前基于数据驱动的智能建模成为了控制科学与工程领域的研究热点。神经网络技术是典型的数据驱动技术,已经广泛应用于过程建模。其中,回声状态网络(Echo State Network,ESN)作为典型的递归神经网络,训练速度快,泛化能力强,能够有效处理动态时序数据,因此研究新型可靠的ESN用于复杂工业过程建模具有重要的理论意义和
学位
本文全面分析的了无人机集群编队的控制策略,对无人机集群编队系统的运动学模型进行了数学建模,同时对无人机集群的协同控制器进行深入的研究,针对传统无人机编队控制策略存在过于依赖领航者以及通信延迟的问题,进一步完善了无人机编队建模的方法;同时针对滑模控制器的指数趋近律进行优化,并优化改进控制算法,采用理论分析结合仿真、实际飞行实验的数据来加以验证。主要研究内容如下:首先,本文基于弹性系统模型,在不考虑环
学位