面向新材料检验检测领域的文本信息识别方法研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:feimaocug
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新材料产品种类多样、属性复杂,特别是生物质新材料领域,存在产品转化率差异大、成本高和附加值低等特点,无法实现各类资源的综合利用。检验检测服务作为新材料质量把控的关键环节,由于用户在检索过程中定义模糊,导致检索内容与服务目标匹配程度较低;同时检测机构服务能力不同,对送检样品的特征也提出了严格的要求。自然语言处理作为人工智能领域的重要分支,基于文本描述的信息识别技术可以解决这一问题。在新材料检验检测领域,人工构造特征需要耗费大量的时间且需要专业人员进行数据维护更新。目前,人工智能发展迅速,神经网络模型具有良好的分布存储和学习能力;深度学习可自动抓取特征,具有较强的适应性和可移植性。因此,为了整合新材料检验检测领域数据,本研究利用网络爬虫技术爬取各大检测网站新材料领域新闻文本,并进行数据库构建,以半监督标注方法对部分特定实体进行标注,选择深度学习结合神经网络模型进行信息识别任务,提升产业高值化利用服务效率。首先,本文搭建了一种基于领域适应的深度学习神经网络模型,采用BERT预训练模型作为神经网络模型的嵌入层,字词向量的融合使模型获得充分的语义表示,并缓解了传统嵌入模型无法应对一词多义的问题。选择双向长短期记忆网络作为特征提取层,将嵌入层特征向量进行提取,前后方向的记忆网络不仅可以提取过去的语义信息,还可以对未来信息进行预测。其次,注意力机制中对编码器的隐藏状态进行加权平均得到后续的输入变量。最终,通过条件随机场将输出结果按照规则进行排序,保证输出结果符合文本语句的序列形式。在公开人民日报数据集上进行神经网络模型测试,经实验,所构建的神经网络模型准确率可达到92.30%,召回率为92.46%,综合评价指标F1值达到92.38%,已基本满足常规领域的识别要求。针对新材料检测领域数据规模小、标签长度复杂和共享边界信息等的问题,本文提出了基于参数迁移和对抗训练的BERT-ADBC模型并在新材料检测领域数据集进行信息识别实验。基于模型参数的迁移学习可以为领域模型训练提供良好的初始化效果,节省了训练所需的时间;同时BERT嵌入方式与传统嵌入方式进行比较,采用BERT嵌入方式的模型提升效果为1.34%;对抗训练的引入降低了准确率与召回率的间隔差距,减少了分词任务与识别任务中共享信息过多而造成的边界混淆问题;最终新材料检测领域信息识别效果准确率、召回率、F1值分别为84.45%、83.08%和83.76%。为更好方便用户访问,本文利用Mysql数据库系统对新材检测领域实体信息进行数据库存储,并采用前后端接口实现信息识别技术应用;设计新材料检测领域信息识别技术界面,通过功能介绍、场景应用等实现信息识别技术的可视化展示。
其他文献
报纸
通过原位热稳定性试验、紫外-可见光谱、拉曼光谱、X射线光电子能谱(XPS)、循环伏安法和充/放电试验,研究了聚丙烯酸(PAA)对全钒氧化还原流电池(VRFB)正极电解液的热稳定性和电化学性能的影响。结果表明,PAA添加剂可以提高V(V)电解液的热稳定性。在室温条件下,少量的PAA添加剂对电解液电化学性能影响不大,仅能轻微地提高正极电解液的电化学性能和VRFB的能量效率。此外,以PAA添加量为3%的
期刊
<正>特殊钢广泛地应用于各个工业领域与人民生活,它是目前人们关注的重大装备制造和国家重点工程建设所需的关键材料,是钢铁材料中的高技术含量产品,其生产和应用情况代表了一全国家的工业化发展水平,特殊钢占钢总量的比例、特殊钢产品结构、特殊钢质量和特殊钢应用等是反映一个国家钢铁工业发展的重要标志。高品质特殊钢应该至少包括以下两个方面的含义:一是工业化过程中先进装备制造所需要的特殊钢品种;二是表现出高质量特
期刊
企业环境违法规制中的和解,以对企业环境违法的类型进行合理的分类为基础,进而分析论证每种类型的基本性质,最后从法理和实践操作的角度提炼出“和解要素”并予以适度的量化,从而为解决企业环境违法规制中的和解问题提供理论指导。企业环境违法侵害的法益不仅包括私益,还包括社会公共利益。企业环境违法具有自身的特点,加之生态环境保护法律规范庞杂,对违法事项的规定难以体系化归纳,因此在企业环境违法的分类上适宜采取“以
学位
农业作为我国的基础产业,其发展一直备受关注。中共中央、国务院于2021年发布的《关于实现巩固拓展脱贫攻坚成果同乡村振兴有效衔接的意见》更加体现了国家对农业的关注。大力提高农业技术科研水平、创新能力和推广能力,实现我国现代农业转型升级就要因地制宜地探索出适合当地农业技术推广的模式。由于新经营主体发挥的作用有限,农业合作社在农业技术推广的过程中不可避免地会遇到各种问题,需要在推广模式等很多方面进行进一
学位
当代商业银行多为综合性银行,其中个人信贷业务是各银行主要业务之一,各开办信贷业务的银行均会在个人信贷产品投入较多研发资金,以创新产品来满足人们日益增长的信贷需求。当前,我国金融秩序较为良好,经济社会发展环境不断改善,个人信贷业务以其极大的客群和可观的贷款余额,已成为各金融机构业务发展的重要抓手。然而我们也应看到,商业银行开展个人信贷业务伴生各类风险,在业务模式、信用评估、资金返还管理、法律法规、抵
学位
亚胺在构建精细化学品和各种具有药理活性的N-杂环化合物中至关重要。多相光催化利用可见光驱动亚胺合成,反应条件温和、反应途径绿色洁净,是一种极具前景的合成技术。二氧化钛(TiO2)作为多相光催化体系中的典型光催化剂材料,具有反应性高、稳定性好、生态无毒、成本低等优点。在本论文中,我们从TiO2半导体材料出发,运用不同策略对其加以修饰改性,同时结合适宜氧化还原中介的选择,构建了两个基于TiO2和2,2
学位
氨作为重要的工业化学品,主要来源于传统的Haber-Bosch法,然而高温高压下运行能耗高,污染严重,因此亟待开发绿色低碳的合成氨新方法。电化学合成氨可以在电能的作用下打破氮气活化热力学能垒,因此引起国内外学者广泛关注。电化学合成氨中,高活性的阴极催化剂能够提高氨生成速率和法拉第效率,同时高质子电导率的电解质有助于提供氮气还原所需的充足质子源。基于此,本文围绕电解质和催化剂做了以下研究工作:(1)
学位
报纸
牵引车鞍座是主车与挂车之间一个重要的连接部件,由于半挂车前进时鞍座会受到各个方向的冲击力,且冲击力度大,因此对于鞍座的质量要求极高。传统的鞍座由锻钢件制成,耐撞击性好,但成本比铁更高,因此,在确保鞍座质量要求的情况下,通过铸造鞍座来达到以铁代钢的目的。据统计,在牵引车鞍座以铁代钢的过程中极易发生呛火、冷口、缩松、夹砂、夹渣等问题,产生的废件造成大量经济损失。本文针对以上问题,通过分析调整铸造的工艺
学位