基于BERT的多特征融合农业命名实体识别

来源 :农业工程学报 | 被引量 : 0次 | 上传用户:WANGBING0425
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是农业文本信息抽取的重要环节,针对实体识别过程中局部上下文特征缺失、字向量表征单一、罕见实体识别率低等问题,提出一种融合BERT(Bidirectional Encoder Representations from Transformers,转换器的双向编码器表征量)字级特征与外部词典特征的命名实体识别方法.通过BERT预训练模型,融合左右两侧语境信息,增强字的语义表示,缓解一词多义的问题;自建农业领域词典,引入双向最大匹配策略,获取分布式词典特征表示,提高模型对罕见或未知实体的识别准确率;利用双向长短时记忆(Bi-directional Long-short Term Memory,BiLSTM)网络获取序列特征矩阵,并通过条件随机场(Conditional Random Field,CRF)模型生成全局最优序列.结合领域专家知识,构建农业语料集,包含5295条标注语料,5类农业实体.模型在语料集上准确率为94.84%、召回率为95.23%、F1值为95.03%.研究结果表明,该方法能够有效识别农业领域命名实体,识别精准度优于其他模型,具有明显的优势.
其他文献
针对一步热解活化技术制备的秸秆多孔生物炭的表面活性位点偏少、孔隙结构不发达和电化学性能欠佳的问题,该研究以水稻秸秆微波磷酸水热炭为前驱体,开展500~900℃下多孔生物炭的制备试验,探讨不同温度下多孔生物炭的结构及电化学性能.结果表明,随着活化温度的升高,水稻秸秆多孔生物炭产率由50.31%降低到33.47%,800℃多孔生物炭的C含量最高,为74.09%.多孔生物炭表面上含有的-OH、C-O-C等含O基团和吡啶氮、吡咯氮、石墨氮和氮的氧化物等含N基团,有利于其在电解质中的润湿性,降低离子转移电阻.随着活
猪产品是我国广大百姓餐桌及日常生活中必不可少的,随着百姓生活质量的提升,我国猪肉需求量也日益增多,此种背景下也催生了生猪养殖产业的快速发展.传染性猪病会对养殖户带来巨大的经济损失,一些猪传染病还是人畜共患传染病的,对人类健康也会造成影响.猪弓形虫病就是一种可人畜共患的传染性猪病.以下就以弓形虫病作为研究对象,着重探讨了弓形虫病的诊断与防治措施,希望能为兽医专业领域人士及广大生猪养殖户提供些许参考.
猪支原体肺炎的出现对猪的防疫产生影响,猪支原体肺炎主要是肺炎支原体引起的一种慢性呼吸道疾病,发病后降低生长速度和饲料利用率,如果短期内未根治,则会给养殖场带来严重的经济损失.在生猪养殖的过程中,其中的疾病问题会限制生猪养殖产业的发展,尤其是传染病的出现,很容易导致猪群患病.本文以猪支原体肺炎诊断为基础,对具体的防治对策进行分析.
叶绿素含量与叶面积指数是反映作物长势的重要理化参数,准确、高效定量估计小麦叶绿素含量与叶面积指数对于产量预测和田间管理决策具有重要意义,无人机(Unmanned Aerial Vehicle,UAV)遥感影像具有高空间分辨率的优势,被广泛应用于作物理化参数反演,但现有叶绿素含量与叶面积指数反演模型受土壤、阴影等背景噪声的影响较大,该研究旨在探索去除无人机多光谱影像中的背景像元能否提高作物叶绿素含量和叶面积指数反演精度.首先通过过绿-过红植被指数对多光谱图像阈值分割,提取试验小区所有小麦像元平均反射率.然后
为筛选出适宜安顺市种植且受市场欢迎的辣椒品种,探索各性状的相关性,2020年引进了85个辣椒品种进行栽培试验.通过分析总结得出各品种的丰产性、稳产性、适应性、抗病性及性状间关联性,表现为单果重、株高、单果长对辣椒产量影响较大.结合当地消费现状及国内市场需求,筛选出14个较对照有较大增产幅度的品种,作为全市辣椒种植的储备及更新换代品种.
为解决目前分娩猪舍内环境调控系统能耗大,传染病交叉传染风险高的问题,将人体热舒适理论应用于养殖动物,提出应用辐射供能和局部送风技术进行母猪分娩猪舍的环境调控.该研究结合工程案例,基于CFD软件对安装新型环境调控装置的产房内动物体感温度和空气流动进行了模拟仿真分析,并同常规空调系统的全年能耗指标进行了计算和比较.结果表明,通过辐射供能和上送下排局部送风技术,可以在确保动物所处围栏内空气温度适宜(16~27℃)的同时减少排风热损失,系统能耗相较于传统的湿帘风机系统可降低42.04%.该系统可在节约能源的同时优
针对目前的Voronoi路径规划算法生成的Voronoi图弯曲冗余,依据Voronoi地图规划路径实时性差,规划出的路径弯曲,机器人导航时转折次数多、时间成本高、效率低等问题,提出一种基于骨架关键点重规划的Voronoi图法路径规划算法.首先对机器人构建的二维栅格地图进行预处理,去掉地图中的噪点和毛边,填充边界上细微的裂缝,然后提取地图的骨架,搜索出骨架中的关键点,将关键点按原来的相邻点连接关系重新连接,生成新的笔直的骨架,并采用降梯度采样方法平滑依据骨架规划出的路径.在经过多次仿真实验和实际实验验证后,
目前,我国天然橡胶园割胶主要以人工为主,劳动强度大、效率低、工作环境恶劣,本研究设计了一种固定复合运动轨道式割胶机.首先,通过Solidworks三维建模方法建立整机模型;其次,对其固定装置、复合运动装置、切割装置等关键部件进行设计,并用Ansys对切割刀片进行静力学分析,得出切割刀刃受到最大应力时满足其安全裕度、符合刀片强度的设计要求;最后,通过选取干胶产量为响应值,切割角度、切割深度、耗皮厚度为显著性参数,基于Box-Behnken设计试验得到响应值与显著性参数的二阶回归模型.试验表明,当切割角度为2
为表达猪流行性腹泻病毒(Porcine epidemic diarrhea virus,PEDV)中和抗原表位COE蛋白,分析其免疫原性,为PEDV的检测和亚单位疫苗的开发奠定基础.参考GenBank中PEDV COE基因序列,人工合成并经生物信息学综合分析后,将合成的基因片段插入原核表达载体pET-32a(+),构建重组表达质粒pET-32a-COE,将鉴定正确的重组质粒转化至大肠埃希氏菌TransB(DE3)中,用IPTG诱导目的蛋白表达,并进行SDS-PAGE鉴定;然后用纯化的目的蛋白与弗氏不完全佐
报道了黑龙江省被子植物新记录2种,高茶藨子(Ribes altissimum Turcz.ex Pojark.)、掌裂蛇葡萄(Ampelopsis delavayana var.glabra(Diels&Gilg)C.L.Li).凭证标本保存于东北林业大学植物标本馆(NEFI).