【摘 要】
:
人类营养健康命名实体识别旨在检测营养健康文本中的营养实体,是进一步挖掘营养健康信息的关键步骤.虽然深度学习模型广泛应用在人类营养健康命名实体识别中,但没有充分考虑到营养健康文本中含有大量的复杂实体而出现长距离依赖的特点,且未能充分考虑词汇信息和位置信息.针对人类营养健康文本的特点,该研究提出了融合规则与BERT-FLAT(Bidirectional Encoder Representations from Transfromers-Flat Lattice Transformer,转换器的双向编码器表征量
【机 构】
:
食品质量与安全北京实验室,北京 100083;中国农业大学信息与电气工程学院,北京 100083
论文部分内容阅读
人类营养健康命名实体识别旨在检测营养健康文本中的营养实体,是进一步挖掘营养健康信息的关键步骤.虽然深度学习模型广泛应用在人类营养健康命名实体识别中,但没有充分考虑到营养健康文本中含有大量的复杂实体而出现长距离依赖的特点,且未能充分考虑词汇信息和位置信息.针对人类营养健康文本的特点,该研究提出了融合规则与BERT-FLAT(Bidirectional Encoder Representations from Transfromers-Flat Lattice Transformer,转换器的双向编码器表征量-平格变压器)模型的营养健康文本命名实体识别方法,识别了营养健康领域中食物、营养物质、人群、部位、病症和功效作用6类实体.首先通B E RT模型将字符信息和词汇信息进行嵌入以提高模型对实体类别的识别能力,再通过位置编码与词汇边界信息结合的Transformer模型进行编码以提高模型对实体边界的识别效果,利用CRF(Coditional Random Field,条件随机场)获取字符预测序列,最后通过规则对预测序列进行修正.试验结果表明,融合规则与BERT-FLAT模型的人类营养健康领域识别的准确率为95.00%,召回率为88.88%,F1分数为91.81%.研究表明,该方法是一种有效的人类营养健康领域实体识别方法,可以为农业、医疗、食品安全等其他领域复杂命名实体识别提供新思路.
其他文献
科学的潜在土地利用冲突识别能够判别和协调冲突用地类型,也是有效解决当前日益严峻的土地利用冲突的基础.该研究以鞍山主城区为研究对象,基于耕作和建设适宜性评价系统开展耕地适宜性评价,通过ArcGIS软件以及耦合协调度模型进行冲突分区识别,进而根据冲突类型提出耕地差别化利用建议.研究结果表明:鞍山主城区周边耕地可划分为9类区域,包括3类潜在土地利用冲突区,占总面积的22.20%;3类耕作优势无冲突区,占总面积的67.33%;3类建设优势无冲突区,占总面积的10.47%,综合考虑城市周边耕地自然、区位和社会经济条
无人机遥感技术已逐渐成为获取作物表型参数的重要工具,如何在不降低测量精度的同时提高空间分辨率和测量通量受到表型研究人员的重视.该研究以玉米为研究对象,获取5个生育期无人机图像序列,结合小波变换与双三次插值对数码影像进行超分辨率重建,提取原始影像和重建影像的冠层结构、光谱等参数.基于单一参数和多模态数据构建地上生物量估算模型.结果表明:重建影像质量较高、失真较小,其峰值信噪比为21.5,结构相似性为0.81.航高60 m的重建影像地面采样距离与30 m的原始影像相近,但每分钟可多获取0.2 hm2地块的图像