检修环境中口语化文本的实体关系识别研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:wwwerroo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在环保话题火热的当今,我国风电事业在能源政策的领导下得到蓬勃发展,并在全国各地建成八大“千万千瓦级风电基地”。为了维持风电机组的正常运行,定期的检修工作必不可少。目前风电场的检修工作一般由专业的检修工人完成,检修工人通过攀爬器爬至高空,对设备进行检查,并通过纸笔对检修情况进行记录。一般的风电机组在50米以上,百米风电机组也在随着需求的增加而逐渐投入使用,这对检修工人的安全产生了极大的威胁。与此同时,我国互联网技术飞速发展,可以为检修工人配备一个小型智能化设备,只需要对设备讲出检修情况,设备在进行一系列处理后自动完成检修表的填写,这将会释放检修工人的双手,增加高空作业的安全,也会提高一定的工作效率。本课题以风电检修领域为背景,对语音识别后的口语化文本进行文本纠正以及实体关系识别处理,实现非结构化数据向结构化数据的转换。语音识别后的文本质量将会直接影响接下来的任务处理,文本纠正是提高文本质量的一种常用手段,本课题在文本结构化处理之前,利用HM-BERT对文本进行纠正处理,该模型主要依靠BERT预训练模型的MLM机制实现文本纠正,并在BERT模型的基础上,引入分级掩码的策略确定需要被掩码的字词,最终对所掩码的字词进行预测得到质量较高的文本。在得到质量较高的文本之后利用BERT-PA进行实体关系识别任务,该模型同样是基于BERT预训练模型实现的,为了能够更好地对嵌套实体和重叠关系进行识别,模型采用指针网络的方式对实体关系进行标注。模型首先预测文本中主实体的起始位置和结束位置,并通过一个二分类器进行指针对的匹配,以此提高对于嵌套实体的识别效果。接下来对主实体相对应的客实体及其关系进行预测,客实体的预测方式同主实体相同,结合主实体信息和全局特征,将客实体结果标注在不同的预定义的关系向量上,最终得到实体关系三元组。实验基于风电场提供的语音数据集完成,利用公开的语音识别技术得到初步的文本数据,再通过HM-BERT模型对文本进行纠正处理,最后基于BERT-PA模型实现实体关系的识别。实验证明,在文本纠正方面,HM-BERT模型对于领域口语化文本纠正效果有一定的提升,并具有更强的鲁棒性,这也为其他类型的文本的纠正提供了思路;在实体关系识别方面,BERT-PA实体关系识别模型的效果表现更好,尤其是对于嵌套实体和重叠关系识别方面效果更为明显,且有着很好的普适性。
其他文献
如何提高风电功率预测精度一直以来都是风电预测领域亟待解决的问题。因为较高的风功率预测精度,为风电场并网、电网的调度提供科学依据而且还能使得风电场免于因较低风功率预测精度而罚款。是一个兼具经济及社会研究价值的问题。随着社会的快速发展,人们对于能源的需求越来越高,伴随而来的是严重的空气污染等一系列的生态环境问题。如何在兼顾经济发展的同时还能顾忌到环境问题是一个急需解决的棘手问题。能够减少污染的清洁能源
学位
加热炉是一种典型的工业控制系统,其加热过程存在着较强的参量耦合、高度非线性和抗干扰能力。而加热炉又是钢铁行业的主要能源,随着加热工艺的要求不断严格,传统的控制方法已不能适应高精度的要求,急需一种新的理论来支撑。针对某钢厂2250 mm轧机生产中出现的上述问题,提出了一种基于多层模型匹配的优化设计方案,用于优化工艺参数,提高产品质量,降低能耗,提高产品的综合竞争力。通过对有关理论的深入分析,结合工业
学位
探讨在我国现在情侣服饰产业发展背景下,以互动性要素设计探究为目的,针对情侣装的设计手法进行应用研究,具体包括绪论、情侣装的概况与分析、情侣间的互动性分析、情侣装互动性要素设计探究与应用、情侣装互动要素的设计实践五个方面。在此基础上,综合理论与实验进行了系列设计实践。首先,本文主要针对情侣装,运用文献归纳法概述了情侣装的定义、发展及分类,试从服装设计基础理论知识的角度出发,结合各学科对情侣装设计进行
学位
近几年,由于5G的高度普及与疫情的催化,国内各大博物馆纷纷重启布局数字化平台,“云游博物馆”等多样化的展示形式不断涌现,用户体验的提升也越来越受到重视,博物馆的品牌化发展战略也成为国内博物馆积极探究和实践的课题。本文以博物馆互联网产品为研究对象,运用以用户为中心的“超级用户思维”理论,分析我国博物馆互联网产品目前存在的共性问题,结合对国内外优秀案例的解析,探讨如何将“超级用户思维”应用于博物馆领域
学位
随着遥感技术的发展,越来越多的高空间分辨率影像被应用到各行各业,无人机的出现与快速发展使得遥感图像的获取变得越来越便利,遥感图像分类作为遥感应用于实践过程中不可缺少的过程成为研究的热点问题。相较于一般图像,遥感图像包含了光谱信息,丰富的光谱信息为分类任务提供了很大的帮助。近年来,伴随着科学技术的进步,深度学习得到了快速的发展,并很好地应用到了遥感图像分类任务中。本文针对遥感图像在分类任务中存在的一
学位
为探究南昌市某工业区表层土壤中多环芳烃污染特征及来源解析,分析了该工业区内企业周边表层土壤中PAHs的含量水平、组成特征及空间分布特征,应用效应区间低值(ERL)和效应区间中值(ERM)法及苯并(a)芘毒性当量法对土壤质量进行生态风险评价,采用异构体比值法和主成分分析法分析其来源。结果表明:南昌某工业区表层土壤中15种PAHs均值为155μg/kg,与国内相关研究比处于较低水平。PAHs组成以菲、
期刊
热连轧是冶金产业重要的生产过程,作为主要产品的热轧带钢在国民生产的各行各业中占据重要地位,热连轧的工艺主要包括加热、粗轧、精轧、层流冷却、卷曲等工序,具有流程长、参数多、过程复杂的特点,是典型的复杂工业生产过程。随着社会的不断发展,用户对于带钢产品的质量要求也越来越高,因此实现生产过程的运行优化,进一步改善带钢产品的质量成为钢铁企业发展的重点。科学客观的评价方法可以为企业对产品质量的改进提供有力支
学位
稀土电解过程中,电解槽内部包含多种复杂的物理化学变化,槽内众多参数存在不确定性且无法连续或在线测量,属于复杂的工业过程。氧化稀土作为稀土电解的原料,电解槽内氧化稀土的浓度状态关系到生产过程中电解槽内部的物料平衡,会直接影响出炉稀土金属的品质。目前,国内外多数稀土电解厂家仍采用人工手动的方式添加氧化稀土,少数厂家采用定时定点下料装置添加氧化稀土,这些下料方式未充分考虑电解槽内部氧化稀土浓度状态对电解
学位
在北方寒冷的地区,供暖是日常生活的基础保障。目前,一些用户仍然使用燃烧散煤的方式保障供暖需求。燃烧散煤不仅消耗大量化石能源,而且也造成环境污染问题。为此,国家提出了“煤改电”的政策,且在日后的生产发展中,提倡使用清洁能源,减少对化石能源的依赖,实行清洁能源和储能结合的方法。通过光伏储能与热泵供暖结合,对储能过程的双向DC-DC变换器进行研究。首先,分析了在蒙西部分地区的电采暖电价,并结合太阳能发电
学位
在服装行业迅速发展的当今,我们可以看到多姿多彩和形态各异的设计,人们往往用各种风格去定义它,但更注重传达思想、情感的一类服装设计是很难去定义所属风格的。坎普与服装设计的融合可以说就是其中之一,随着坎普风在时尚行业慢慢崭露头角,大部分人往往会被其风格所吸引,但并不知道如何去“描述”和感悟到设计者的想法。在此背景下,本文希望通过对于“坎普”的分析研究去探索坎普风与女装设计的融合手法。本次毕业设计的主题
学位