基于Python的文本数据增强系统设计与实现

来源 :宁夏工程技术 | 被引量 : 0次 | 上传用户:yu8886882
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对少样本场景下样本不均衡性、数据量不足易导致模型过拟合的问题,采用自然语言EDA文本数据增强方法,设计了基于Python的文本数据增强系统。该系统利用Python+Flask框架实现了简单易操作的Web交互界面,总体架构由文本预处理、单文本增强和批量文本增强3个主要模块组成。对比分析增强前后的文本数据在枸杞虫害文本数据集的训练效果表明,该文本数据增强系统进行不同训练集规模数据增强后得到的枸杞虫害文本描述在4倍数据增强时分类效果最好,准确率达到了85.3%,与传统方法SR和VAEHD相比,EDA方法下的文
其他文献
长九(神山)灰岩矿周边环境复杂,林地多、居民多,为减小露天高边坡爆破滚石、飞石对其影响,临近边帮部位采用控制爆破,对边帮较陡或倒悬、爆破无法控制的部位,采用爆破和机械处理(挖机+破碎锤)相结合的施工措施。根据现场地质岩层条件,适当增加临空面侧预留边帮宽度,减少爆破后冲对预留边帮的影响。爆破后,达到预期爆破效果,边坡滚石得到控制,可为类似工程提供借鉴。
碳中和愿景擘画了国家碳减排与气候治理的宏伟蓝图,但中国经济结构和能源结构决定了该目标实现的艰难.当前煤炭仍是我国能源安全的基石,并将在未来很长时间内一直发挥着巨大
基于一维可压缩非定常不等熵流动模型,采用广义黎曼变量特征线法数值模拟隧道压力波.以国内某条地铁线路为背景,研究了地铁A型车以140 km/h恒速通过7560 m隧道时,五种坡型、三种坡度对隧道压力的影响,给出隧道内压力最大值位置.结果表明:坡型对隧道压力的影响大于坡度;V型和W型坡隧道最大正压值随着坡度的增大而增大,人字坡反之;人字坡隧道最大负压值随着坡度的增大而增大,V型坡和W型坡反之.
低阶煤炭资源量丰富,催化热解是实现其清洁高效利用的重要途径。目前,低变质煤催化热解技术存在焦油产率低,重质组分高,催化剂回收难等发展瓶颈。为此,设计制备了磁性核壳型载体HZSM-5@SiO2@Fe3O4(简写为HSF)和煤热解磁性Mo/HSF催化剂。研究了SiO2隔热包覆层的层数,热处理温度和时间,以及包覆HZSM-5载体层对HSF磁性的影响。以补连塔煤为研究样品,探讨了磁性Mo/HSF催化剂的煤热解催化活性及磁选回收
煤的显微组分定义与分类的国际标准“ICCP system 1994”是国际煤和有机岩石学委员会(ICCP)历经26 a(1991-2017)完成,按照显微组分组和发表的时间,该标准共分4个部分,分别是镜质体(1998)、惰质体(2001)、腐质体(2005)和类脂体(2017)。“ICCP system 1994”目前已被国际上从事煤岩学和有机岩石学研究的科研工作者广泛采用。国际煤和有机岩石学委员会在1994年第46届ICCP年会上确定了镜质体显微组分组、亚组和显微组分的定义和分类,并于1998年
煤系石墨是煤经受岩浆热变质及构造应力作用进入石墨化阶段的产物,发育不同程度石墨结构、具有石墨或类似石墨的物理化学特征和工艺性能,是战略性矿床晶质石墨的重要补充。为了给煤系石墨矿产资源评价和开发利用提供可靠基础,从煤系石墨成矿机制及演化途径研究入手,深入分析相关测试技术方法的适用性,以我国典型煤系石墨矿区测试数据统计分析结果为依据,制定科学合理的煤系石墨鉴别指标,建立煤系石墨分类分级体系。研究表明,煤系石墨是由不同演化程度的石墨化组分和残留煤岩显微组分组成的集合体,具有矿物学与岩石学或矿石学的双重属性,不同
针对现有对松散煤体自然发火温度场运移特点试验装置的不足,根据实际松散煤体燃烧特点,自主设计研发了煤火发展演化模拟实验系统。选取陕西省咸阳孟村煤矿煤样为研究对象,利用该装置模拟松散煤体燃烧过程,分析松散煤体燃烧过程中高温区域的分布及纵深移动规律,再现松散煤体从着火至燃烧最后燃尽过程中高温区域的蔓延过程,剖析温度区域迁移机制,分析高温区域关键点氧气体积分数变化规律。结果表明,在松散煤体燃烧过程中,煤样体系温度变化尺度随着时间的增加先上升后下降,试验运行600 h后,整体燃烧室降至环境温度;试验过程中松散煤体高
采空区煤自燃是影响矿井安全生产的主要灾害之一,标志气体与煤温是煤自燃预警的关键参数,2者之间的数学模型及其统计学特征是构建煤自燃预警指标体系的基础。通过程序升温控制实验,获得了88组煤样气体体积分数随煤温的变化曲线,选择指数函数、多项式函数和Logistic回归函数对气体体积分数进行拟合,以R2,方差SSE和均方差MSE等参数为评价指标,确定了Logistic回归函数为最佳拟合函数;利用Logistic函数拟合标志气体的变化曲线,得到CO与C2H4
神东矿区煤炭资源丰富,但淡水资源匮乏,高氟矿井水已成为制约矿井水循环利用的关键因素,然而高氟矿井水的来源和形成机制尚未进行过系统研究。系统采集了神东矿区62组不同水体样品,利用数理统计、离子比及因子分析等手段,在矿物溶解与沉淀,蒸发浓缩,阳离子交换,竞争吸附和人为污染作用等方面探讨了神东矿区高氟矿井水的F-质量浓度特征和空间分布规律,并分析了其来源和形成机制。结果显示:神东矿区矿井水中F-质量浓度为0.16~12.75 mg/L,平均值为5.01 mg/L,有7
为满足远程带式输送机的巡检需求,并在一定程度上缓解巡检人员的工作,设计了一种巡检载具,并对其运动特性进行研究。该巡检载具采用STM32嵌入式开发板作为主控,负责对巡检载具的运动控制,包括启动、停车、变速等运动控制,并利用高速摄像的实验方法,对巡检载具的运动特性进行实验和研究,求解巡检载具整体系统的传递函数以及变化特性,以此作为巡检载具优化控制的依据。同时,巡检载具中选用了一些传感器,并搭配工业控制计算机作为上位机进行数据的采集和回收工作。