基于深度学习的政务知识图谱问答系统设计与实现

来源 :贵州大学 | 被引量 : 0次 | 上传用户:neverneverland
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着人工智能、大数据等计算机技术的高速发展,利用这些新兴技术提升政府治理智慧化水平,为数字化政府建设赋能成为趋势。政务问答系统作为数字化政府建设的重要一环对提升政府行政效率具有极大价值。而现有的政务问答系统多是依赖人工编制的问题模板,根据关键词来匹配数据信息以返回给用户。这使得问答系统普适性较低,同时难以正确理解复杂问题语义导致回复内容质量有限,用户体验较差。针对以上问题,本文构建知识图谱作为政务知识库,研究基于深度学习的问答方法,并基于此设计和实现了一个政务智能问答系统。本文的主要工作和创新点如下:(1)政务领域知识图谱构建。针对当前政务服务领域缺乏公开的知识图谱数据问题。基于Beautiful Soup工具实现一个爬虫系统对公开政务服务网站数据进行获取。基于提取到的数据设计出政务知识图谱模式层,并以此利用Neo4j图数据库完成政务知识图谱的数据存储并实现可视化展示。(2)基于深度学习的政务领域问答方法。针对问句命名实体识别问题,研究了融入预训练模型和多头自注意力机制的BERT-Bi LSTM-MHA-CRF命名实体识别方法,通过引入大规模文本预训练获取到的知识结合注意力机制的权重分析来更好地提取问句深层语义信息;针对问句意图识别问题,使用融合多层隐藏层参数的BERT-RCNN模型完成意图识别。实验表明本文提出的模型达到了较好效果。(3)政务知识图谱问答系统设计与实现。通过对政务问答进行需求分析,以政务知识图谱作为知识库,以基于深度学习的问答方法为核心设计与实现政务领域问答系统,并对系统分别进行功能测试和非功能测试,测试结果显示本系统可以满足设计需求。通过在问答系统中引入知识图谱,可以为语义理解提供丰富的背景知识,结合深度学习模型能更深入的识别出问句语义。从而促进了政务问答领域的智能化发展,对实现公共服务高效化具有重要意义。
其他文献
医疗数据发布有助于对数据进行挖掘分析研究并助推智慧医疗的发展,同时也带来了医疗数据隐私泄露的风险。目前在数据发布场景中,仍存在数据接收者利用已有数据或者背景知识对发布数据进行攻击,造成个人隐私信息泄露的问题。但目前缺少较好的方法和系统对医疗数据隐私泄露风险进行评估。因此,针对上述问题,基于隐私偏好、信息熵和相似性距离等相关理论和方法,提出了数据发布的隐私泄露风险评估方案以及隐私保护方案,并设计与实
学位
随着全球定位系统和无线通信网络的迅速发展,基于位置服务已经成为日常生活中或不可缺的一部分,涉及到生活的各个方面。但在为人们生活提供便捷的同时,也增加了位置数据的安全隐患。针对位置数据的攻击导致用户个人敏感信息泄露,但由于位置数据量较大,导致现有大多位置隐私保护协议难以兼顾数据的效用性和隐私性,且无法抵抗基于背景知识的攻击,对隐私保护水平缺乏合理的度量。并且,提供优质的服务需要对位置数据进行挖掘分析
学位
在图片数据随着人们在网络上的信息交互呈现指数级增长的今天,如何快速、准确的检索到用户所需图片,是亟待解决的问题。目前图像检索中,基于深度学习的图像检索模型能提取到图像的语义特征。但是,在深度学习模型训练过程中,常会因为训练数据不足,导致训练不充分,且部分图像数据具有较为复杂的背景,使神经网络难以学习到正确的映射关系。在得到图像的语义特征后,近似最近邻算法中的乘积量化算法能对高维特征进行降维,减少计
学位
目前计算机学术界呈现出典型的“大团队”和“大项目”趋势,内部通常是针对某个相对集中的领域或某个问题开展研究的。科研团队通常包括多个课题组,有限的服务器资源难以满足不同课题组的科研需求,并且科研团队在进行开发、维护、和部署过程中浪费大量时间。此外,课题组的科研产出成果难以被社会各界所试用,导致我国难以产生高价值且能落地的科研成果,离产业化的目标相距甚远。针对以上问题,本论文设计并开发了基于Kuber
学位
文章基于岷县18个乡镇的农户及中药材种植农民专业合作社(以下简称“合作社”)的问卷调查及访谈数据,运用二元Logistic模型,分析农户参与合作社的意愿及其影响因素。结果显示,年龄、中药材收入、合作社的发展情况、参与方式的多样性以及市场价格的波动对农户参与意愿影响显著,农户对合作社的认知、合作社的标准、带头人等对农户参与意愿影响不显著。
期刊
随着数字经济的快速发展,电子签约已经广泛地应用于金融、政务、教育等多个领域。传统的电子签约系统对中心化的服务器依赖性强,如果这个中心受到来自外部或内部的攻击,存储的数据就存在丢失、泄露、篡改的可能性。因此,传统的电子签约系统需要寻求新的技术方案去解决上述问题,联盟区块链作为目前广受关注的一种区块链,它具有部分去中心化、不可篡改、可追溯等特性,恰好可以解决这些问题。但是,区块链中通常存储的是交易信息
学位
在5G海量机器类通信(massive Machine Type of Communication,m MTC)的大规模物联网环境下,存在海量带层级关系的异构物联网设备,由于异构物联网设备采用不同的加密参数和不同的加密体制,从而带来了物联网设备之间跨域分层认证问题。解决物联网设备之间的跨域分层认证问题可以为物联网设备之间的安全通信带来保障,更好推广5G技术在大规模物联网的应用。本文以异构签密和可传递
学位
基于投入—产出模型,从智慧化生产资料在农业生产中的投入视角,提出一种测算智慧农业发展水平的研究方法,并基于OECD数据库,对包括我国在内的全球25个主要经济体2000—2018年的智慧农业发展水平进行测度和分析。研究发现:该智慧农业发展水平测算方法可以打破指标体系评价方法的局限性,具有较高的科学性和可行性;无论是发展水平还是发展速度,智慧农业在各经济体的发展都呈现显著差异,整体上,中等收入经济体的
期刊
区块链作为比特币、以太币和莱特币等数字货币的技术支撑,具有公开透明性、去中心化和防篡改等特性,采用分布式网络、博弈论和密码学等相关技术,解决了传统中心化架构产生的高成本、垄断和低效率等问题。区块链技术被视为很多传统行业的突破口,在物联网、金融、供应链等领域具有广泛的应用需求。但目前区块链系统在效率、安全性等方面还亟待改进,无法满足大部分应用场景的需求。其中,共识算法是区块链系统的核心,对系统的安全
学位
随着分布式计算和分布式机器学习的快速发展,对分布式节点间的数据通信速度提出了更高的要求。传统的分布式计算应用程序利用TCP/IP网络进行通信,其数据传输速度与GPU计算速度存在不匹配问题,影响了分布式计算的整体性能。因此,远程内存直接访问(Remote Direct Memory Access,RDMA)被广泛应用于分布式计算中,以加速网络数据传输。然而,RDMA网络采用明文通信且缺少身份验证机制
学位