基于知识抽取的徽茶知识图谱构建与应用

来源 :安徽农业大学 | 被引量 : 0次 | 上传用户:jian85733547
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
徽茶产业作为安徽的传统优势农产业,保障安徽山区经济,但是近些年来徽茶产业发展停滞,急需高新技术为其二次赋能。现在是数字化时代,信息技术越来越普及,农业与信息技术的结合可以充分挖掘农业数据,更加科学高效地发展农业。通过构建基于徽茶的知识图谱有助于从海量的信息中快速挖掘徽茶知识,将碎片化的信息进行加工整合。本文对基于知识抽取的徽茶知识图谱的构建进行了深入研究,具体的工作内容如下。(1)本文首先对徽茶产业、知识图谱和知识抽取技术的研究现状进行了梳理和归纳。接着,总结了知识图谱构建技术和知识抽取技术中常用的预训练模型以及特征提取模型。然后使用Scrapy爬虫框架爬取了茶叶网站中徽茶相关的文本数据,并筛选了专家整理的书籍中徽茶的相关文本作为实验数据。(2)针对徽茶数据多源且复杂,传统的浅层序列标注模型在实体识别阶段获取上下文依赖信息能力弱的问题,本文提出了ATea-BTC(Anhui Tea-BERT-TENER-CRF)模型。首先使用BERT(Bidirectional Encoder Representation from Transformers)对数据集进行预训练,将字符转化为低维稠密向量;再将TENER(Transformer Encoder for NER)和CRF(Conditional Random Field)构建于BERT之上,通过TENER增强距离与方向感知的注意力,解决了常规方法难以区分上下文方向性的问题,在最大程度上提高边界识别的性能,达到良好的实体抽取效果。(3)针对徽茶数据涉及多个环节,实体间关系复杂且标注数据不足的问题,本文提出ATea-RPA(Anhui Tea-RLRE-PCNN-ATT)模型进行关系抽取。先使用RLRE(Reinforcement Learning for Relation Extraction)模型对句子进行降噪,再通过远程监督的PCNN(Piecewise Convolutional Neural Networks)模型来抽取关系,最后通过多示例注意力机制Attention捕捉更细化的语义特征,在最大程度上优化关系抽取的性能。(4)本文基于对实体识别和关系抽取的研究进行知识抽取,结合知识融合和知识存储的相关操作,完成对徽茶知识图谱的构建。为了满足不同人群的需要,搭建了基于知识图谱的徽茶知识问答平台。该平台可以协助茶农科学育茶,辅助茶企业做决策,帮助消费者选茶,弘扬徽茶文化。
其他文献
遥感影像的分类工作一直都是处理遥感影像的重点工作,获取遥感影像中所包含的地物类型分布信息具有很强的现实意义,而传统的人工解译的方法需要耗费大量的人力物力,效率低下。近年来,卷积神经网络在处理遥感图像分类任务上得到了广泛应用,其效果相较其他分类方法效果更加显著,但是由于不同地区的地物类别数据分布不均衡等原因,同一模型在不同地区的预测效果有较大差异,为了更好的研究近年来环巢湖区域的土地利用类型分布情况
学位
种子就像是农业种植的“芯片”,是国家发展的物质基础,可以体现出国家的真正实力和影响力,也能体现一个国家的担当。手工计数和光电管计数是早期人们常用的种子计数的方法,存在操作繁琐、成本高、效率低下等问题。本文研究的作物自动计数方法以小麦种子为实验研究对象,研究了基于机器视觉图像处理技术的小麦籽粒自动计数方法,具体内容如下。首先,实现了基于传统图像分割的形态学算法和改进分水岭算法的小麦种子自动计数。具体
学位
农村金融知识普及教育一直是国家在推进全面乡村振兴工作的重点任务之一,但是农民能够获取相关知识的渠道存在一定的不便性,即使是利用搜索引擎获取信息,大多数情况下,搜索引擎并不能直接给予用户简洁准确的答案。为了给农村用户提供便利的知识获取途径,本文对问答系统进行了深入研究,知识数据是问答系统的基础,针对农村金融领域的知识特点,构建了农业企业信息知识图谱和问答对形式的常见问题库,以此作为问答系统的数据层依
学位
茶树种质资源是我国重要的战略性资源,准确区分不同的茶树树种是进行茶树种质资源研究和保护的前提,有助于推动我国茶产业的高质量发展。本研究首先自建茶树叶片图像数据集,然后利用多种深度学习模型分别建立茶树品种鉴定模型,通过性能对比选择较优的模型,再通过候选框优化获得最优鉴定模型并设计实验分析模型的泛化能力,最后以优化模型为基础完成茶树品种鉴定软件的开发。完成的主要研究工作和成果总结如下:(1)根据研究需
学位
农业新闻是推进农业现代化过程中的一个重要方面。农业新闻具备科普和指导功能,宣传国家政策、传播农业经验、农业技术。利用信息技术提高新闻传播效用是新闻传播方式种重要一环。农业新闻传播方式随着时代进步发生变革,读者对农业新闻报道的内容、形式都有着新要求。针对农业新闻报道互动性不高、报道效率较低的问题[1],本文从农业新闻受众的需求出发,构建基于知识图谱的农业新闻推荐系统,旨在提高用户阅读积极性,尽可能发
学位
安徽省六安市的桃种植面积约23万亩,居全省第一。六安脆桃早熟桃采收时间比其他省市早15~20天,具有较高的经济价值。种植桃在当地农村的脱贫攻坚、乡村振兴中扮演着举足轻重的角色。目前,六安脆桃正处在由数量到质量的过渡阶段。在商品化的流通中,脆桃的品质是影响其经济效益的重要因素。在分级的方式上主要有人工式和机械式。他们的缺点分别是:高投入、低效率,分级依据特征不统一和易造成机械损伤、分级特征单一。从而
学位
建立农产品供应链溯源体系是保障农产品质量安全的有效手段,传统的农产品供应链溯源体系存在中心化管理问题,溯源体系中的数据易丢失、易篡改、无法有效溯源等。以共识算法和密码学算法为基础的区块链技术具有分布式存储、去中心化、防篡改、公开透明和可追溯等特性,为实现农产品供应链溯源数据的去中心化存储、防篡改和可追溯提供了完善的技术支撑。但是由于区块链公开透明的特性,溯源数据直接上传区块链会造成农产品供应链溯源
学位
在梨树生长过程中,缺素症经常发生,实时、无损地监测梨树营养状况,对于梨树养分精准管理具有重要意义。传统的梨树缺素识别主要依靠于果农经验和理化值检测,前者对果农个人素质要求较高,精度低;后者则存在操作繁琐,测量周期长,效率低下的缺点。近红外光谱检测技术具有无损、快速、高效、精准的特点。本文以安徽农业大学高新技术产业园区的梨树叶片作为研究对象,利用微型手持式近红外光谱仪对梨树生长期(4月-5月)叶片进
学位
小麦作为我国的主要粮食作物,种植面积大,经济效益高,病虫害的发生将直接影响到小麦的高品质高质量,造成一定的经济损失。本文根据小麦病虫害领域数据多源异构的特点,利用知识图谱组织小麦病虫害领域知识,采用深度学习模型分析自然语言问句信息,设计并实现了基于知识图谱的小麦病虫害问答系统。本文的主要研究工作如下:(1)构建了小麦病虫害知识图谱。本文通过对小麦病虫害领域的数据进行分析,自上而下构建了小麦病虫害知
学位
当前,在线购买商品逐渐成为一种主流,生鲜商品作为生活中必不可少的物资,正在经历着这种变革。各种生鲜电商平台中商品种类繁多,信息庞杂,用户往往难以进行有效选择,推荐系统的引入可以有效缓解该类问题。推荐系统主要通过分析用户的历史行为,向用户推荐其可能感兴趣的商品,从而提升用户体验。图神经网络因其可以通过图上节点信息的传播来学习节点的嵌入表示,已成为推荐系统研究的热点。但已有基于图神经网络的推荐方法,主
学位