基于文本的农作物属性抽取技术研究

来源 :湖南农业大学 | 被引量 : 0次 | 上传用户:scotty_zhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是谷歌首先使用在自家搜索引擎中,旨在实现大规模搜索个性化推荐的一项伟大的发明,除此之外,在文本语义理解和知识问答对话问题上也能起到很好的辅助作用。中国农业科学叙词表是诸多农业领域专家共同编写的农业领域百科辞典,适合以它为基础构建农业知识图谱,但这样构建的农业知识图谱只有农作物实体和基本的用、代、属、分、参等关系,并不包含农作物属性。为进一步完善农业知识图谱,需要将农作物属性补充进去。鉴于人工方式费时费力,研究基于文本的大规模自动化属性抽取技术对完善农业知识图谱具有十分重要的意义。本文在根据农业叙词表构建的农业知识图谱基础上,构建了农作物属性抽取数据集,提出并训练了Bert-Bi-LSTM-CRF属性抽取模型,设计和实现了一个农作物属性抽取系统,将文本中的农作物属性和属性值以三元组的形式提取出来补充到农业知识图谱。具体工作如下:(1)构建了农作物属性抽取数据集。数据集以中国农业科学叙词表中收录的农作物实体为主体,使用python爬虫技术从百度百科获取农作物实体对应词条下的农作物属性文本语料,经过数据清洗后使用BIO标注方法,构造了生长环境、实体名、种类、产地、花期、果期和颜色等七种属性标签,在doccano平台上进行数据标注工作。构建的数据集共有农作物实体数据1727条,字符144943个。(2)提出了Bert-Bi-LSTM-CRF农作物属性识别模型。针对训练数据不够和训练时间长的问题,将无监督语料上预训练的Bert嵌入向量作为Bi-LSTM-CRF的输入,提出了农作物属性实体识别的Bert-Bi-LSTM-CRF模型,在农作物属性抽取数据集上微调训练。实验表明模型Bert-Bi-LSTM-CRF的F1值为0.8319,综合对比性能优于Bi-LSTM、CNN-LSTM和Bi-LSTM-CRF三种模型。(3)设计并实现了一个能够自动化抽取农作物属性及其属性值的农作物属性抽取系统。其主要由数据导入和属性抽取两部分组成,通过运行模型Bert-Bi-LSTM-CRF进行推断,以三元组的形式输出农作物、农作物属性和农作物属性值。
其他文献
中国综合国力的不断提高和对外交流的不断深入,为中国文学的“走出去”创造了越来越有利的条件。莫言在2012年获得诺贝尔文学奖,这是一个良好的开端,也是将中国文学推向世界前沿的推动。中国有许多优秀的文学作品,但中国文学最大的困境是海外传播和接受的问题。这些问题的解决一定程度上是离不开翻译的。《蛙》是诺贝尔文学奖得主莫言的代表作品之一,葛浩文是中国现当代文学的首席翻译家。葛浩文翻译的《蛙》在西方出版之后
学位
近年来,国家对青少年价值观教育问题的关注度不断上升。小学阶段是个体价值观形成的奠基阶段,小学生价值观教育成功与否不仅关系到学生个体的未来成长,而且关系到整个民族甚至整个国家文明的发展进程。基于足球教育的基本功能与价值,2009年我国启动了校园足球工作,并于2014年底启动了校园足球特色学校的创建工作。校园足球战略不仅是提高中国足球普及程度和竞技水平的基础工程,也是实现教育立德树人根本任务的育人工程
学位
近代以来,中国形象和文化在西方世界被丑化,中国主动译介的文学作品在美国反响甚微,直到中国网络文学借助互联网媒介的发展抓住了美国文化市场,这种尴尬逐步开始缓解。国内关于中文网络文学对外翻译与推广的研究始于21世纪伊始,之后研究热度逐年增加。笔者所采用的后殖民主义翻译视角在国内网络文学研究中尚属首次尝试,给相关研究思路带来了一些拓展,对促进中国文化”走出去”有一定实践意义。后殖民主义翻译研究主要基于欧
学位
米粉是我国南方地区人们的传统主食,其口感爽滑有劲道,且食用方便,备受人们喜爱,是我国消费量最大的米制品。如何提高米粉品质是食品科技工作者长期追求的目标。目前米粉品质的改善方式多样,而且在已有的改善研究中,对于湿热处理和发酵技术的单一应用颇多,但是将两者联用的处理方法对大米粉性质及粉条品质的影响研究还是鲜有报道。因此,本课题以大米粉为原料,采用乳酸菌发酵与湿热联用处理改性技术,研究了联用技术处理对大
学位
铝塑复合膜是锂离子电池可以实现外形尺寸灵活变化的关键,其热封性能的优劣会影响到电池在使用过程中的安全。针对152μm厚的PA/Al/CPP铝塑复合膜,研究了在不同热封条件(热封温度、热封时间和热封压力)下铝塑膜的热封强度,通过理论计算选取合理的参数范围,利用万能材料试验机测试了热封后铝塑膜能承受的最大拉伸载荷,并将此作为衡量热封强度大小的标准;根据单因素实验结果分析热封强度在不同热封工艺参数下的变
期刊
大面积、快速、准确地识别水稻种植范围对国家农业资源监测和国家粮食安全具有重要意义。随着遥感实时性和运行性不断提高,通过遥感图像解译方法来提取自然资源信息成为一种非常高效的方式。传统遥感解译基于像元、对象的方法存在特征浅、参数受人工干预度高、不能准确提取多地物等不足。随着以卷积神经网络为主要技术代表的深度学习理论与技术的不断涌现,其在图像处理领域中取得了良好的效果。本文利用高分遥感影像作为数据源,通
学位
无人机图像作为一种现代化、多元化、高效化的遥感技术,能够监测农业农作物生长情况,为农作物提供一个良好的生长环境。近年来,无人机图像遥感技术不断实现新突破,广泛应用在农业生产和科技创新等领域,利用无人机图像遥感技术能够为农作物的生长管理提供较为准确的数据支撑和决策依据,成为农业现代化进程中的有效手段。本研究以同时期不同拍摄高度的11个品种的甘蓝型油菜为研究对象,利用无人机搭载高清摄像头获取甘蓝型油菜
学位
随着人们对水产品需求的不断提升,集约化水产养殖产业凭借其先进、高效等优势获得蓬勃发展。然而,集约化养殖的高密度容易导致水质恶化,养殖水质的科学管理已成为制约其发展的主要瓶颈。考虑到养殖水温是影响水产品产量与质量最为重要的水质参数,而现有水温预测模型在水产养殖领域的应用尚浅,养殖人员多依据养殖经验对养殖水温进行管理与控制,出错率高且效率低下,本研究围绕池塘养殖水温预警提出一套完整解决方案,即基于改进
学位
叶绿素作为高等绿色植株的重要生理色素,其对绿色植物的作用也不言而喻,在绿色植物所依赖的光合作用过程中叶绿素是不可或缺的基础。现阶段的叶绿素含量测定的方案较多,基于计算机视觉方向的叶绿素测定也有很多学者在研究。但是,大部分基于计算机视觉的研究中对于视觉设备的要求较高,同时,由于其固定的设计软件运行环境等因素,使得基于计算机视觉的叶绿素含量识别研究存在一定的局限性,本文主要选择移动设备作为计算机视觉的
学位
发展社会工作是党中央对社会建设领域做出的重要决策部署,也是民政部门的一项重要职责。而加强社会工作服务机构内部控制建设,是落实这一决策部署的重要前提。由于社会工作服务机构大部分为民间非营利组织,因其非营利、规模小的特点,对内部控制建设并不重视。文章围绕民间非营利组织的定义、内部控制的含义以及重要性,逐一对其在内部控制方面出现的问题,如民间非营利组织会计对风险评估程序缺乏重视,内部控制意识薄弱,内部控
期刊