基于本体的建筑安全事故预测

来源 :安徽建筑大学 | 被引量 : 0次 | 上传用户：alan39

【摘要】

：

建筑安全研究虽然成果丰富,但是建筑安全事故依旧频发。当前对建筑安全事故案例分析的研究还是主要依赖专家评估,具有研究效率低、不够智能化且研究结果容易受主观性影响的缺

【作者】

：

李志刚

【出处】

：

安徽建筑大学

【发表日期】

：

2020年01期

【关键词】

：

建筑安全本体文本挖掘 TransH TextCNN

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

建筑安全研究虽然成果丰富,但是建筑安全事故依旧频发。当前对建筑安全事故案例分析的研究还是主要依赖专家评估,具有研究效率低、不够智能化且研究结果容易受主观性影响的缺点。时至今日,存在大量的包含建筑安全事故案例信息的建筑安全事故调查报告,其中包含的大量领域专家知识和经验信息未能得到充分重用。在此背景下,针对当前对于建筑安全事故案例研究方法的缺点,提出基于文本挖掘的方法来对建筑安全事故的不安全因素进行分析挖掘。通过基于互信息和邻接熵的领域词发现算法对建筑安全事故调查报告中的原因分析部分进行挖掘分析,得到了538个建筑安全事故不安全因素关键词。为了解决传统的建筑安全事故预测方法没有充分融合领域知识的问题,提出了基于建筑安全事故本体知识结合TextCNN(Convolutional Neural Networks for Sentence Classification)文本卷积神经网络模型的建筑安全事故预测方法。通过对不安全因素之间以及不安全因素与建筑安全事故类型之间相关性的分析,结合建筑安全领域规范和文献等知识,构建了建筑安全事故的不安全因素本体库。接着通过TransH(Translating on Hyperplanes)基于超平面的翻译模型将建筑安全事故本体库中不安全因素的概念知识向量化表示后,得到了不安全因素的概念知识向量。通过与朴素贝叶斯、支持向量机、逻辑回归、随机森林和多层感知机等五种传统机器学习模型分别在One-Hot独热编码表示的数据集、词向量表示的数据集以及融合建筑安全本体概念的向量数据集三种数据集上进行训练预测的结果对比,表明本文提出的包含建筑安全事故本体知识的不安全因素向量结合TextCNN模型预测方法在正确率、精度、F1值和AUC值均有所提高。本文首先介绍了建筑安全事故频发的现状和研究意义。在对建筑安全事故研究现状和本体的应用研究现状的分析总结后发现,现有的建筑安全事故案例研究方法具有效率低、智能化水平不高等缺点。结合目前存在的大量相关领域知识未被有效重用等问题,以及本体在各个行业领域的广泛有效运用的背景下,提出了将本体技术运用在建筑安全事故预测领域。然后介绍了本文的研究的主要内容和研究思路。接着介绍了事故致因理论以及本文实验涉及的文本挖掘、爬虫、本体构建、TransH模型、分类模型等相关技术,并展示了本文的研究技术路线,为本文的研究奠定了理论和技术基础。在通过对2012年到2019年近8年来发生的建筑安全事故快讯信息进行统计分析后,对建筑安全事故的发生规律有了初步的了解。明确了建筑安全事故调查报告数据收集的主要事故类型和地区。通过Scrapy爬虫框架对建筑安全事故调查报告数据进行收集。通过对建筑安全事故调查报告内容结构的分析,确定研究的主要文本内容并将其初步结构化。使用基于互信息和邻接熵的领域词发现算法对建筑安全事故调查报告的原因部分进行了不安全因素的挖掘分析,为建筑安全事故的预测提供了特征信息。通过皮尔逊相关系数分析不安全因素之间的线性相关性。使用word2vec对不安全因素词向量进行训练得到不安全因素的词向量,通过对其聚类来获得不安全因素在语义上的相似度。利用TF-IDF(Term Frequency–Inverse Document Frequency)词频逆文档频率关键词算法分析了不安全因素和主要的事故类型间的相关性。为建筑安全事故不安全因素本体库的构建提供了现实的参考依据。从分析结果与现实情况对比,论证了建筑安全事故调查报告的挖掘价值。通过参考建筑安全领域相关文献和国家标准以及对不安全因素和建筑安全事故类型之间关系的分析基础上,明确了本体库的构建范围。而后对建筑安全事故的不安全因素和事故类型的概念类及其关系属性进行了定义。最后使用本体开发软件Protégé构建本体库。在建筑安全事故类型预测部分,将建筑安全事故数据集分别采用One-Hot独热编码表示、词向量表示以及基于本体知识的向量化表示。分别采用两组模型对这三种数据集进行训练预测。一组是典型传统的机器学习方法:朴素贝叶斯、支持向量机、逻辑回归、随机森林和多层感知机,另一组是TextCNN模型。通过实验结果对比分析后表明本文提出的基于本体知识的向量化表示结合TextCNN模型方法在预测的正确率、精度、F1值和AUC值上均有提升。文章的最后,阐述了论文的主要成果和结论以及未来的研究期望。图[35]表[16]参[60]

其他文献

消费惯性作用下农村居民和城镇居民消费影响因素的差异研究

笔者主要基于消费存在惯性这一基本思路,基于GMM方法使用全国省际面板数据研究消费惯性存在的情形下,居民收入增长、财政支出以及通货膨胀等因素对消费增长的影响作用进行研

期刊

消费惯性动态面板数据影响因素

双臂机器人协调运动的关节轨迹规划

针对双臂机器人协调运动 ,给出关节轨迹规划的两种方案 ,其一是基于最小载荷分配的关节轨迹规划 ,其二是基于最小关节广义驱动力的关节轨迹规划 ,均避免了矩阵的奇异值分解 ,

期刊

双臂机器人载荷分配广义驱动力轨迹规划

国画元素在中式品牌服装中的运用

国画是中国传统文化的重要组成部分,是中华民族的艺术瑰宝,它无论是在意韵表达、色彩渲染、笔墨情趣还是经营布置上,无不体现出鲜明的民族特色和丰富的笔墨技巧,其独特的绘画

学位

国画元素中式品牌服装服装设计千里江山图

“画”雪狂欢节——记佳能照片打印机户外体验活动

相信由莫文蔚代言的佳能“即拍即打”系列的广告已经深入人心了，在广大时尚数码消费者心中留下了不可磨灭的印象，“即拍即打”的便利性、亲和力，早已众口皆碑，可以说，哪里有佳能的

期刊

照片打印机佳能户外消费者亲和力

微众银行的盈利能力评估

随着经济的高速发展,民营经济对国民经济起到无足轻重的作用。自2013年金融“国十条”颁发以来,我国铺开全部由民间资本倡始设立民营银行,实现民营银行常态化设立。截至2019

学位

民营银行微众银行盈利能力案例分析

基于拉瓦尔效应的气水两相喷雾数值模拟研究

煤炭是我国重要的基础能源和原料,随着我国煤矿机械化自动化水平的提升,煤矿安全生产形势持续稳定好转,与之相反,近年煤矿新发尘肺病人数则呈逐年升高态势。煤矿井下粉尘浓度

学位

粉尘拉瓦尔效应气水两相喷嘴数值模拟

锂离子电池石墨烯基硅碳负极材料的制备及其性能研究

锂离子电池以其因其优异的电化学性能和环境友好的特点在储能器件领域得到广泛的应用。限制锂离子电池电化学性能的主要因素是电极材料,硅具有最高的理论比容量和较低的脱嵌

学位

锂离子电池负极硅碳氮掺杂石墨烯氮、硫共掺杂石墨烯

高血压对冠状动脉侧支循环形成的影响

<正>高血压病、糖尿病、吸烟、高脂血症、高龄、肥胖等是导致冠状动脉粥样硬化的明确原因,而冠状动脉粥样硬化是冠状动脉侧支循环形成的触发因素[1-2]。冠状动脉侧支循环在冠

期刊

高血压冠心病冠状动脉侧支循环

硅—石墨烯复合锂电极材料的嵌锂机制研究

锂离子电池（LIBs）由于其工作电压高、容量大、可重复充放电等优势,已经被广泛的应用到日常生活的各个领域。作为自然界中丰富的元素,硅拥有着比其他负极材料更高的理论容量,达

学位

锂电池负极材料硅-石墨烯复合材料密度泛函理论嵌锂机制

提升组织效率促进企业可持续发展——中国移动四川公司的效率提升实践

伴随行业转型的深化，组织效率低已经成为公司有效应对竞争，落实改革要求的主要短板。经过近一年的探索，公司采取了优化组织结构及流程等措施有效提升了公司的组织效率，大大提高了

期刊

组织结构企业可持续发展中国移动四川生产经营

基于本体的建筑安全事故预测

与本文相关的学术论文