基于农业知识图谱的问答系统设计与研究

来源 :常州大学 | 被引量 : 1次 | 上传用户:greatteset
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着农业现代化进程的推进,基于农业领域的知识服务体系成为农业信息化研究的热点问题。传统的信息获取方式以搜索引擎为主,搜索引擎返回大量网页链接,答案高度分散并且呈现多源异构的特点,无法迅速且准确地为农业相关工作者提供知识服务,用户体验感差。领域知识图谱的发展为特定领域内的知识问答提供了高质量的知识库基础。本文基于构建的农业知识图谱,对农业知识问答系统进行研究。主要研究内容如下:(1)构建农业领域知识图谱。本文首先使用Scrapy框架进行web农业文本数据的爬取,实现了农业领域数据的规模化采集。随后根据处理后数据的特征对知识图谱进行存储方案设计。最后利用Cypher语句将结构化的实体数据存入Neo4j知识图谱中,构建了数据质量高、覆盖面广、层次分明的农业领域知识图谱。(2)研究基于知识图谱的问答算法。基于已构建的知识图谱将本文的问答算法划分为命名实体识别和问句分类两个子任务。在实体关系类查询任务中,提出一种联合多特征的PBERT-BiLSTM-CRF模型对农业实体进行识别。集合农业文字的特殊性,添加字本身和部首偏旁的自定义联合多特征进行实验,最后与其他模型通过实验对比,结果表明,本文联合多特征的PBERT-BiLSTM-CRF模型在命名实体识别任务中有更好的效果。针对用户输入的症状类问题,本文使用了基于BiSLTM的自注意力分类模型。此模型给嵌入带来了一种简单的方式,可以看到句子的哪些特定部分被编码到嵌入中。通过与其他神经网络模型使用处理后的同一数据进行分类实验,结果表明,本文的问句分类模型能对用户的农业症状类问题进行准确的分类。问句分类扩大了问答系统的作用范围,提高了本文基于知识图谱的农业问答系统的价值。(3)设计并实现了基于知识图谱的i农-知识问答系统。通过系统需求分析、系统设计和系统测试,当用户输入农业领域病虫害以及农药相关的自然语言问题时,能够准确地给出相应的文本答案并且实现了知识图谱相应实体关系的可视化。
其他文献
命名实体识别是自然语言处理的基础任务之一。在临床医学领域,围绕医学信息进行数据分析和命名实体识别可为后续构建医学知识库和辅助推荐系统等相关任务提供数据基础。因此,医学命名实体具有重要价值,但医学文本大都为非结构化数据,文本领域性强、实体类型多且行文较为复杂,在命名实体识别过程中会面临更多挑战。本文以中文电子病历为主要研究对象,深入研究病历行文特点和文本实体特征来设计和改进现有模型结构。针对当前命名
学位
传统充气轮胎存在爆胎问题,影响工程机械的正常服役,而免充气轮胎不会爆胎,因此其在工程车辆领域的应用前景看好。仿生技术是近年来的新兴课题,借鉴自然界中生物体的结构特点,将其改良并引入工程机械结构设计中,可以达到提高强度、节省材料等目的。为此,本文在免充气轮胎国内外研究现状分析的基础上,应用仿生技术,提出了一种满足可靠性指标要求的工程机械仿生免充气轮胎结构,并对其承载能力、等效应力、接触压强等进行了研
学位
移动机器人的路径规划分为单目标路径规划和多目标路径规划。强化学习方法能够有效解决单目标路径规划问题,但多目标路径规划问题通常包含多个相互冲突的目标,且强化学习中标量形式的奖励很难同时描述多个目标,导致强化学习算法在多目标路径规划问题中性能不佳。针对上述问题,本文将多目标强化学习(Multiobjective Reinforcement Learning,MORL)应用于多目标路径规划,使用向量形式
学位
近年来,由于网络的日益发达,使用在网络的评价量呈现指数级别上升,这些评论中承载了用户对产品或某一对象的态度和观点,研究这些评论中蕴含的情感倾向具有重要的现实意义。随着对情感分析的深入研究,涌现出许多基于深度学习的各类模型。其中也出现了许多问题,例如基于传统注意力机制的神经网络模型在捕捉句子长依赖关系上的表现并不突出,而能解决该问题的依赖树模型容易忽略依赖弧上的标签信息。另一边,随着科技的发展,用户
学位
近年来,行人重识别技术由于深度学习的发展取得了巨大的进展。然而,目前的行人重识别研究主要是集中在短时间情况下,即行人的衣着不太可能发生改变。这些方法在很大程度上依赖于行人穿着衣物的颜色外观。然而现实中更常见的情况是长时间下,一个人有很大的机会更换衣服,所以现有的方法在此情况下是不可靠的,行人重识别模型应该考虑这种情况。因此,换衣行人重识别任务应运而生,本文针对换衣行人重识别问题,主要做了如下方面的
学位
区块链作为一种去中心化的分布式账本系统受到世界的普遍关注。联盟链作为区块链中的一类,具有高性能、强可控性的特性,其弱中心化的特点也更符合企业属性。因此高性能联盟链系统关键技术研究也是区块链技术研究的一个重要方向。目前对于联盟链系统的性能提升研究主要致力于共识算法的优化,而分片技术的加入能够进一步提高联盟链的扩展性,但是现有的分片协议大多针对公有链系统设计,甚至部分需要硬件依赖。因此,基于联盟链的共
学位
在人体行为识别任务中,基于骨架关节点的模型由于能清晰、直观地表达特征、运算简便,且鲁棒性高,因此倍受关注。但是在传统骨架建模方法中,依然存在空间图构造受预定义影响,忽略了非相邻节点间信息的有效利用,以及常规卷积神经网络对遮挡适应性较差、容易忽略全局特征等问题。针对此,本文在ST-GCN模型基础上,提出几点改进方法,具体如下:(1)提出一种基于全局图遍历的ST-GCN人体行为识别算法。在STGCN模
学位
随着信息技术和人工智能的发展,人脸识别技术的应用越来越广泛,给我们的工作、生活提供了极大的便利。当涉及复杂环境的人脸识别时,人脸识别往往面临很多问题,如遮挡问题、光照变化等。基于这些复杂环境的人脸识别也成为当下研究的热点。针对人脸自遮挡、面部配件、物理遮挡等复杂遮挡问题,本文研究了基于多角度人脸重构和Gabor字典学习的无约束人脸识别。主要包括以下几个方面的内容:首先,许多基于数据、模型分析的方法
学位
任务型对话系统能够以人类语言与用户交流,在多轮交互中监控用户目标,最终完成用户所提供的任务。对话状态追踪是任务型对话系统中承上启下的关键模块,当前研究忽略了槽位与自然语言之间的关联,导致模型无法处理一些特殊的用户表达。此外,传统模型还采用了槽位门控机制并且将对话历史作为输入,这拖累了系统的响应速度,使用户无法获得良好的人机交互体验。针对传统模型忽略了槽位与自然语言之间的关联并且推理速度过慢的问题,
学位
智能手机迅速发展,功能丰富化应用多样化的同时,能耗也不断增加。但由于物理尺寸及电池技术的限制,导致其续航能力得不到提升。智能手机的应用程序离不开网络支持,研究表明,网络请求是造成智能手机耗能的重要原因之一。因此,大量研究者从网络传输方面降低能耗,将网络请求推迟进行合并转发是其中一种方法,但一定程度会影响用户体验。通过对不同使用场景设置不同的延迟时间可在牺牲少量用户体验的前提下降低更多能耗。本文采用
学位