面向农村金融领域自动问答系统的研究与实现

来源 :安徽农业大学 | 被引量 : 0次 | 上传用户:cool_1944
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
农村金融知识普及教育一直是国家在推进全面乡村振兴工作的重点任务之一,但是农民能够获取相关知识的渠道存在一定的不便性,即使是利用搜索引擎获取信息,大多数情况下,搜索引擎并不能直接给予用户简洁准确的答案。为了给农村用户提供便利的知识获取途径,本文对问答系统进行了深入研究,知识数据是问答系统的基础,针对农村金融领域的知识特点,构建了农业企业信息知识图谱和问答对形式的常见问题库,以此作为问答系统的数据层依托;实体抽取、问句匹配是实现问答系统的核心技术,采用BERT-Bi LSTM-CRF模型实现了企业信息领域的实体识别并采用BERT-Attention-Bi GRU模型实现了问句匹配,最终实现了面向农村金融领域的问答系统,具体工作内容如下:(1)构建农业企业信息知识图谱。通过数据爬虫、实体识别、关系抽取等方法,实现公司信息数据采集,并应用传统概率模型方法实现数据间的知识融合,最后将三元组数据导入到Neo4j中构建出农业企业信息知识图谱。(2)构建问答对形式的常见问题库。通过爬虫技术和人工归纳的方式采集到了原始数据集,为了丰富数据集,不仅利用简单数据增强(EDA)方法对问句进行了扩充,同时还利用Sim BERT模型对问句进行生成从而扩充问句语料。(3)设计了基于常见问题查询和基于知识图谱查询。针对基于常见问题查询,主要包含两个模块,检索模块和深度问句语义匹配模块,检索模块基于Elasticsearch实现,深度问句语义匹配采用BERT-Attention-BiGRU模型完成,为了验证该模型在问句匹配任务中的有效性,将模型与传统短文本匹配模型和工业界常用文本匹配模型在已构建的问句数据集上进行对比实验,实验数据表明采用的模型在系统问句匹配任务应用中表现最佳;针对基于知识图谱查询,采用BERT-Bi LSTM-CRF对问句进行实体识别,并利用模板匹配来实现基于知识图谱查询。(4)构建基于面向农村金融领域的自动问答系统。以构建的知识图谱和常见问题库作为数据基础,以自动问答功能为核心,最终开发了基于Web的自动问答系统,为用户提供自动问答服务,为了验证系统的有效性,采取众包的方式对系统进行了测试,系统最高达到96%的准确率。
其他文献
植物工厂作为现代化农业的高级产物,能够有效解决由于气候和地理的差异、耕地面积的减少、工业污染以及土壤污染等原因产生的粮食产质量问题。具体来说,植物工厂是指在完全可控的环境中采用多层次立体种植实现农作物/植物的周期性生产的大型种植类工厂。植物工厂的内部环境设计不仅可以节省空间,提高单位面积生产率,还能够缩短作物生长周期,实现高效生产。本文设计了一种通用的基于匿名认证的多节点感控系统用于植物工厂,该系
学位
机械智能采茶可以同时保证高效率和高芽叶完整率,实现机械智能采茶的关键是使计算机能够“认出”茶叶嫩芽和茶梗。本论文将基于目标检测算法和图像分割算法使用TB-Lai数据集分别建立茶叶嫩芽识别模型、茶叶嫩芽分类模型和茶梗识别模型。本论文的主要研究内容如下:(1)使用在VOC数据集上表现较好的Yolov4、Yolov5、Yolox、Efficient Det、Faster r-cnn和Center Net
学位
选育耐盐作物可有效利用盐碱土地、缓解耕地压力,还能改善土地盐碱化程度,减少盐胁迫对作物的负面影响。作物可从生理、遗传等不同层次产生一系列的盐胁迫适应策略,为更好地阐明植物的耐盐机制,本文对近缘物种的不同耐盐基因型进行分析对比,利用多物种转录组分析揭示作物耐盐关键基因。论文针对传统育种中水稻、玉米盐胁迫调控基因挖掘困难、时效慢等问题,开展了基于多物种转录组分析的作物盐胁迫关键基因挖掘研究。具体研究内
学位
我国是一个缺水国家,但是随着我国城市化进程、经济以及社会发展的加快,对资源的需要量也将愈来愈大,导致水资源的供求关系将进一步恶化。我国农业用水占全国水资源总量的72%,其中90%以上的水资源都用于农田灌溉。目前,国内很多地方都还在采用人工编制水资源规划,这样滞后的管理不但要花费过多的人工、物资和资金,同时效率也还无法获得合理的提高,同时由于灌区传统的灌水方法和粗放的管理使得灌区很难取得节水的效益,
学位
云农场采用物联网技术将分散于不同地点的实体农场汇集到“云端”,实现实体农场“云化”,形成“互联网+农场”的现代农业运营新模式。云农场的主要特点在于通过对农场信息的整合共享与实时更新,及时把握市场需求,能够有效提升农业生产、经营、管理和服务的水平。然而,大别山区特色农业生产经营过程中由于农场信息数据资源获取与整合的不及时,存在产业提升合力不足、农产品附加值低等的问题。因此,本文通过“云”化大别山区特
学位
在茶树的生长过程中,茶树嫩芽的生长信息是判断嫩芽长势和产量的重要依据,也是监测嫩芽生长变化的重要研究内容。目前,获取茶树嫩芽生长信息主要都是以人工监测方式为主,该种方式虽然操作简单,但是非常耗费时间,浪费人力、物力,很难满足智能农业的要求。因此,迫切需要研究及时准确获取茶树嫩芽生长信息的智能化手段。本研究以茶园搭建的监控系统为实验平台,以“农抗早”茶树品种为研究对象。采用深度学习模型识别出茶树嫩芽
学位
学位
学位
遥感影像的分类工作一直都是处理遥感影像的重点工作,获取遥感影像中所包含的地物类型分布信息具有很强的现实意义,而传统的人工解译的方法需要耗费大量的人力物力,效率低下。近年来,卷积神经网络在处理遥感图像分类任务上得到了广泛应用,其效果相较其他分类方法效果更加显著,但是由于不同地区的地物类别数据分布不均衡等原因,同一模型在不同地区的预测效果有较大差异,为了更好的研究近年来环巢湖区域的土地利用类型分布情况
学位
种子就像是农业种植的“芯片”,是国家发展的物质基础,可以体现出国家的真正实力和影响力,也能体现一个国家的担当。手工计数和光电管计数是早期人们常用的种子计数的方法,存在操作繁琐、成本高、效率低下等问题。本文研究的作物自动计数方法以小麦种子为实验研究对象,研究了基于机器视觉图像处理技术的小麦籽粒自动计数方法,具体内容如下。首先,实现了基于传统图像分割的形态学算法和改进分水岭算法的小麦种子自动计数。具体
学位