基于注意力机制的苹果病虫害实体关系抽取研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:orangeboy2222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
苹果病虫害种类繁多,严重影响苹果生产,有效的防治措施能够促进苹果产业发展。大多数权威的苹果病虫害信息都存储在非结构化文本中,由于缺乏对文本数据的结构化管理,导致防治过程中很多实体关系信息无法获取。为了获取结构化的苹果病虫害关系数据,本文利用关系抽取技术在大量非结构化的苹果病虫害文本中挖掘实体的关系信息,为构建苹果病虫害知识图谱、信息检索平台、智能问答系统等提供结构化数据基础。针对苹果病虫害关系抽取中存在数据集匮乏,苹果病虫害实体间关系类别多样、关系类别分布不均衡,以及现有关系抽取方法在苹果病虫害领域表现不佳等问题,本文构建了苹果病虫害关系抽取数据集和关系抽取模型,主要工作内容如下:(1)构建了苹果病虫害关系抽取数据集。针对苹果病虫害领域中关系抽取数据集匮乏的问题,本文在病虫害领域专家的指导下,收集了《苹果病虫害防治》等七本苹果病虫害领域权威书籍作为数据来源,制定了28个苹果病虫害实体的关系类别,并根据定义的关系类别标注了20060条关系实例,为苹果病虫害关系抽取模型提供数据集。相较农业领域的其他关系抽取数据集,本文构建的数据集实现了苹果病虫害领域关系类别的多样化和细粒度化,能够更加专业合理地指导苹果病虫害防治。(2)提出了融合双通道的注意力机制关系抽取模型。该模型采用了双通道机制,每个通道包含不同的字向量和Bi GRU。不同通道获取相同文本的不同语义特征,将双通道获取的多重语义特征进一步通过注意力机制,提升模型的关系抽取能力。实验证明,该模型相较单通道结构,F1值分别提升了2.61%和1.19%,能够更好地挖掘文本语义。该模型在苹果病虫害数据集上F1值达到94.02%,相较CNN、Bi GRU、Att-BLSTM等基线模型,F1值提高了0.3%~8.81%,且在关系类别分布不均衡的情况下表现更优。(3)提出了融合BERT和实体表征的注意力机制关系抽取模型。该模型使用BERT获取文本的动态字符向量表征和实体向量表征。利用Bi GRU提取字符向量表征的语义特征。在注意力机制输出中引入实体向量表征,增强实体特征对模型的影响,实现关系类别的分类。与当前主流模型CNN、BLSTM、Att-BLSTM、BERT和R-BERT相比,该模型在苹果病虫害数据集上表现最佳,F1值为97.59%,提升了1.77%~12.38%,能够更好地应对细粒度关系分类和关系类别分布不均衡现象,证明了模型的有效性。该模型在公共数据集San Wen和Fin RE上的表现优于对比模型,F1值达到71.29%和50.79%,提升了3.4%~11.87%和0.78%~9.32%,具有一定的泛化性。
其他文献
近年来,遥感平台和传感器技术取得了飞速发展,实现了对全球大部分区域的连续重复观测,积累了海量多源、多时相遥感数据。在合成孔径雷达(Synthetic Aperture Radar,SAR)、光学、红外、多光谱等多源数据中,SAR具备全天时、全天候、高分辨、大幅宽等多种优点,是一种良好的信息源。SAR图像广泛应用在目标检测、地物分类、动态监测和变化检测等领域,其中变化检测在国民经济和国防建设上发挥着
学位
无源定位系统通过接收辐射源发射的电磁信号进行定位,具有作用距离远、隐蔽性好等优点,在侦察监视、搜索救援等应用中具有重要价值。单站无源定位系统与多站定位系统相比,没有各站间共视、传输大量数据和布站等问题,具有独特优势。但若仅有单个固定观测站仅测向时,对运动目标跟踪不具有可观测性无法实现定位。在实际环境中,目标通常进行匀速巡航运动,并且巡航速率可以通过识别辐射源型号先验获得。因此,本文研究如何在已知速
学位
目标检测作为无人机场景感知与理解的关键技术,在军事侦察、智能安防、灾情检测等领域都发挥着重要的作用。近年来,随着深度学习技术的飞速发展,无人机图像目标检测的研究取得了重要进展。然而在实际无人机感知场景任务中,常常遇到雨雾等复杂天气条件,雨雾的干扰使得无人机获取的图像质量下降、细节信息丢失,进而导致目标检测性能显著下降。此前针对无人机雾天图像目标检测任务的主要解决方法是先去雾后检测,但此类方法存在两
学位
手势识别具有自然、直观和操作便捷的优点,广泛应用于人机交互领域。根据获取手势输入数据的技术差异,手势识别可划分为2种方法:基于可穿戴设备和基于视觉。在基于视觉的手势识别方法中,静态RGB(Red Green Blue)手势仅需凭借普通的摄像头就可以随时随地被捕获,无需额外的相机采集深度信息,具有更高的实用价值。静态RGB手势具有多样性、多义性和高自由度等特点,此外,光照条件、背景复杂度等因素对识别
学位
为加强环境执法的效力,提高环境监测数据的质量,加大对地方环保履责的监督力度,为此,省以下环保机构监测监察执法垂直管理制度在我党召开的十八届五中全会中予以提出,并要求严格落实。垂直管理机制由此受到生态环保部门重视,积极开展实践探索活动。根据上级决策部署,温州市L区积极开展生态环境垂直管理改革,值得关注。论文以整体性治理理论和府际关系理论为指导,分析构建生态环境部门垂直管理改革理论分析框架,在对温州市
学位
随着国家“一带一路”战略的深入发展,认识海洋,经略海洋,维护我国海洋主权日趋重要。近些年来,我国构建了从外太空到海底的系列立体探测体系,伴随着遥感卫星分辨率越来越高,星地链路传输带宽越来越大,人工和传统的识别方法已经不能满足遥感图像中的目标识别要求。基于卷积神经网络发展起来的图像识别技术展现了优良的性能指标,将基于卷积神经网络的图像识别技术与海量的高清卫星图像资源结合起来,既提高了数据的利用价值,
学位
在真实世界中,植物是自然场景重要的一个组成部分,植物与自然环境交互可展现出各种不同的姿态,如与风作用时的摇曳,又或者枝条和叶片被碾压时产生弯曲变形等。植物的真实感动画模拟关键之处在于其分枝和叶片,在细节上对叶片进行真实感的动画模拟,对于植物动态仿真的整体效果至关重要。现有植物动画模拟研究多关注整体,植物器官如叶片等细节部分的模拟研究尚不深入,并且传统模拟算法求解运动方程的时间较长,不能够进行实时模
学位
三维重建是计算机视觉领域的重要研究方向,其在畜牧养殖业、医学治疗以及数字考古拥有重要的研究意义。其中奶山羊是我国重要的乳用品种山羊,随着奶山羊养殖规模的不断扩大,对奶山羊的个体监控以及羊场的高效管理成为了新的问题。通过对奶山羊进行三维重建,可以将奶山羊的体尺测量方式由人工接触式改为非接触式,实时获取奶山羊体尺信息,有助于实现奶山羊养殖的高效管理。因此本文以西北农林科技大学畜牧教学试验基地采集到的单
学位
公务员群体是我国国家发展和社会运行过程中的重要人才队伍,关系到国家与人民各项事业发展的全过程。随着社会的不断发展,公务员职业发展正面临着新的问题和挑战。在现今的公务员行政体制下,与其他各级公务员相比,青年公务员群体发展日益出现职业满意度及效能感不足等困境。因此,有效解决青年公务员在职业发展中涌现的问题,保障基层行政生力军、主力军力量极为重要。本研究旨在以乐清市各乡镇为例,分析青年公务员的职业满意度
学位
20世纪90年代我国对药械(药品和医疗器械的合称)行业的准入条件放开,药械经营单位(药店、隐形眼镜店等)与使用单位(医疗机构等)的数量迅速增长。此时随着该行业迅速壮大,一些诸如监管政策滞后、安全隐患多发、主体责任不明、监管手段单一等矛盾、问题也逐渐浮出水面。论文以政府规制理论和风险管理理论等为指导,在梳理国内外相关文献的基础上,应用调查研究法、访谈法和文献研究法,深入药械监管队伍,对浙江省瑞安市农
学位