【摘 要】
:
为了进一步提高对煤矿安全生产的预测预警能力,本文基于聚类与分类算法,利用大数据技术,对煤矿生产过程中记录的文本数据进行分析处理,结合实际经验与理论研究,对煤矿文本数据进行综合地、系统地分析,从而达到提升煤矿安全生产风险预控能力的目的。本文以煤矿瓦斯事故案例文本作为语料数据,针对煤矿开采过程中记录的大量文本数据,首先进行了文本预处理操作,包括数据清洗、中文分词、词性标注、词转向量等,在分词部分对比分
论文部分内容阅读
为了进一步提高对煤矿安全生产的预测预警能力,本文基于聚类与分类算法,利用大数据技术,对煤矿生产过程中记录的文本数据进行分析处理,结合实际经验与理论研究,对煤矿文本数据进行综合地、系统地分析,从而达到提升煤矿安全生产风险预控能力的目的。本文以煤矿瓦斯事故案例文本作为语料数据,针对煤矿开采过程中记录的大量文本数据,首先进行了文本预处理操作,包括数据清洗、中文分词、词性标注、词转向量等,在分词部分对比分析了 IKAnalyzer(IK)和ICTCLAS(IC)两种非常流行的中文分词算法在大量中文文本分割问题中的实验结果,发现IC的表现更突出,于是选择IC分词算法对事故文本进行分词及词性标注,并完成了文本信息向结构化数据的转化。为了克服现有聚类算法的缺点,结合K-means算法与Canopy粗聚类设计了CanopyKmeans算法,分析了 CanopyKmeans算法的实现步骤,并借助Hadoop分布式计算平台,使用云计算中的MapReduce编程模型,进行了对瓦斯事故案例文本的聚类分析,得到了 30个聚类主题以及相应的事故类别文本,对这些不同类别的事故文本进行统计,从中择出6个出现频率最高的事故类型文本,作为分类模型的训练集,再通过随机森林算法进行数据集训练,完成对测试组文本文件的分类预测,发现随机森林模型的识别成功率非常可观,并且通过对比决策树算法,发现随机森林预测模型对事故数据和非事故数据的识别成功率均高于决策树算法。从而可以使用随机森林算法模型对未知的煤矿安全文本文件进行预测分类,实现对煤矿安全的分析预警。本文通过对煤矿瓦斯事故案例文本进行数据分析,提高海量文本数据的处理效率,在一定程度上实现了对煤矿安全生产的预测预警,具有一定的应用价值。图31表3参93
其他文献
线控转向系统与汽车传统的转向系相比,同时具备转向轻便性、舒适性、安全性、操纵性以及稳定性,具有更高的性能,随着汽车系统智能化,线控化发展进程,势必会取代传统的机械转向系。本文主要针对线控转向系统的路感模拟及系统容错控制问题展开了研究。首先,对线控转向系统变角传动比特性进行了研究。分析并研究了转向灵敏度不变,仅与车速变化相关的变角传动比特性,并结合单电机线控转向系统的结构和工作原理,通过CarSim
节理岩体中爆炸应力波的传播规律与节理充填介质特性关系密切,具体表现为充填介质的含水率、厚度影响其对爆炸应力波的吸收能力。论文以贵州地区层状节理发育岩体为背景,发现在水平节理隧道施工过程中,由于水的侵蚀及岩体风化变质,节理中出现的泥质夹层会使爆炸能量产生泄漏,爆生气体过早逸出,严重阻碍了爆炸应力波的传播,致使隧道轮廓面出现欠挖、爆破碎石块度过大、冲炮等现象,大大降低了炮孔利用率,直接影响了爆破效果。
移动机器人因自动化、智能化而广泛应用于工业、服务、物流等领域。实现移动机器人自动化、智能化的关键在于定位技术,如何实现定位算法的高精度、良好的实时性、高鲁棒性是目前国内外研究正追求的目标。论文选题来源于安徽省科技重大专项项目“复杂作业环境下重载铸造机器人研制”(项目号为16030901012)。本论文针对机器人定位技术展开了相关研究,主要包括一种改进的双目视觉里程计算法和一种视觉-惯导融合定位算法
随着大数据时代的到来,对于各种实时系统的流数据处理需求越来越多,大部分的流数据处理可以抽象为事件流的处理,从而使得流数据查询可以抽象为复杂事件查询。发展描述能力强的复杂事件查询技术,提高事件查询效率算法是解决大数据时代数据处理问题的主要手段之一,在这种情况下,各种优化方案应运而生,以提高对复杂事件的查询效率。本文假设与事件相关的业务流程由过程模型来表示,在此基础上,提出了一系列查询优化规则及算法。
淮南矿区大部分煤层属于单煤层,工作面开采多为初次采动,对于初次采动的地表移动变形规律的研究已趋于成熟,而关于重复采动地表变形、覆岩位移和应力演化特征的研究相对较少。重复采动地表变形相比初次采动更加剧烈。研究重复采动条件下地表产生的裂缝的发育规律,可以丰富淮南矿区重复采动地表变形规律;研究工作面采宽、采厚的设计以实现减小覆岩运动剧烈程度,对类似地质采矿条件下重复采动工作面尺寸设计具有一定参考意义。结
经过长期的煤炭开采,煤炭的伴生产物煤矸石已经成为储量较大的工业固废,不仅侵占土地,还造成了严重的水污染和大气污染。但是,目前的煤矸石资源化利用还局限于做路基、制砖等低值的方式。有许多学者致力于煤矸石在陶瓷制备方面的研究,但是受到煤矸石中杂质的影响,样品的性能等都不够理想。本文首先以煤矸石和煤泥等固废为主要原料制备了多孔陶瓷,研究了玻璃粉作为添加剂对样品力学性能、孔结构等方面的影响。其次,用熔盐法制
水泥土因施工方便、成本低及振动小等优点,被广泛应用于地基处理、路基加固以及斜坡支护等领域。鉴于纯水泥土强度不足和耐久性差,同时为减少水泥使用,本文采用偏高岭土等量替代部分水泥,并在碱激发作用下改善其力学和耐久性能。首先对不同偏高岭土和氢氧化钠掺量下的水泥土进行无侧限抗压强度试验,确定偏高岭土和氢氧化钠的较优掺量;然后在偏高岭土和氢氧化钠较优掺量的基础上,分析不同浓度氯化钠溶液侵蚀下冻融循环和干湿循
随着智能手机、数码相机等手持式图像采集设备的普及,人们对于高信息量图像的需求与日俱增。在光学成像领域,高信息量和高分辨率一直是互相制约的因素。图像拼接技术在保持图像较高分辨率的同时能够扩大视野,实现图像的信息整合。在图像拼接过程中,最为关键的步骤是图像配准。本文基于SIFT特征提取算法,从改进特征提取算法和提高拼接精度两方面入手,对不同情况下图像的配准和拼接进行深入研究。具体工作如下:1.为提升S
我国经济的发展离不开煤炭资源,但是我国独特的地质及水文地质条件对煤炭资源的开采有很大的影响,在煤矿开采过程中,经常会发生一系列的水害事故。矿井水害已经成为影响煤矿开采的主要灾害之一。尤其是在我国华北和华东地区,很多煤层之上都覆盖着新生界松散层,在新生界松散层底部普遍存在着一层承压含水层,一般称为“底含”或“四含”。该含水层成分主要是砂土、砂砾,渗透性好,且非胶结,大多数直接发育在煤系地层顶部,对煤
目的:发育期尼古丁暴露与许多子代发育不良有关。小胶质细胞在脑发育的整个阶段都发挥着重要作用。目前尚不清楚尼古丁在神经发生过程中对小胶质细胞的发育有着怎样的影响?这种影响进而对神经干细胞的发育又会产生何种作用?本研究拟通过建立母亲尼古丁暴露小鼠模型,从个体、组织及分子水平,探讨母亲尼古丁暴露对子代海马小胶质细胞极化、神经干细胞发育、及小鼠神经发育的影响及机制。为育龄期女性戒烟和尼古丁发育毒性提供科学