基于知识图谱的新冠问答系统设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:kmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网高速的信息产出对信息检索技术提出了更高的要求,促使人们在获取信息时从传统的搜索引擎式检索系统转向更为友好的智能问答系统。知识图谱的出现使得结构化的知识数据的存储和理解变得更加便利,从而推进知识图谱问答系统在各领域的应用。在医疗领域,时值2020年新型冠状病毒肺炎疫情全球性爆发,医疗相关知识获取需求凸显。为了满足用户对新冠医疗领域知识获取的需求,设计并实现了基于知识图谱的新冠医疗问答系统。在内容上主要聚焦新冠医疗领域,通过以下三个方面的研究工作,设计并实现一个基于知识图谱的问答系统。首先通过数据采集及预处理、知识抽取和融合等过程,最终构建一个新冠医疗知识图谱并利用图数据库存储,数据源为使用爬虫爬取各大百科网站和医疗网站的数据;然后结合新冠医疗知识图谱设计一种基于预训练模型的特征融合问答方法,该方法采用了多层特征进行融合的方式,例如在路径排序阶段融合了词法、句法等浅层特征和深层语义特征;最后采用基于Python开发的Web框架Django实现系统服务端,采用基于Android实现了“新医答”App,以此作为用户的主要入口,同时为了兼容PC端用户,实现了Web端应用平台。从而实现了基于知识图谱的新冠医疗问答系统。通过在人工标注的中文问答数据集上的实验,所设计的智能问答方法的F1值达到了90.8%,相较于去除某个特征的问答方法均有明显的提高。此外,所设计与实现的新冠医疗问答系统最终能有效地为用户提供高效的新冠疫情防控、舆情引导、智能问诊及百科问答等服务。
其他文献
电液伺服阀作为液压系统的关键元件,广泛应用于航空航天等国防领域。由阀套和阀芯构成的滑阀副是伺服阀的核心部件,其加工精度要求较高,一般加工误差在1~3微米以内。径向间隙和圆角作为滑阀副的两个主要几何特性,其加工质量直接影响伺服阀的输出特性。对滑阀副径向间隙和圆角进行直接测量难度大,研究一种高效率、低成本的测量方法具有重要意义。本文通过分析径向间隙和圆角对气动流量曲线产生的影响,采用支持向量回归的方法
学位
改革开放以来,我国医疗卫生事业快速发展,医疗服务水平显著提升。然而,人口的老龄化以及公众健康意识的增强,使得居民对医疗服务的需求急剧增长,导致医疗服务供需矛盾日益加剧。提高医疗服务的可达性,是缓解供需矛盾的有效途径,许多学者分别采用路网矢量模型和空间栅格模型研究了医疗服务的可达性。由于路网矢量模型无法评估非路网区域的可达性,而空间栅格模型的计算精度相对较差,于是本文构建了融合路网矢量模型和空间栅格
学位
计算机视觉(Computer Vision,CV)算法已经被广泛地应用于日常生活的许多领域。伴随着物联网技术的快速发展,在嵌入式系统诸如CV算法等多媒体应用需要更高效的处理来满足其实时性要求。由于多媒体数据(如图像和视频)通常格式规整,数据处理逻辑一致且相关性不高,因此适合使用单指令多数据(Single Instruction Multiple Data,SIMD)指令来加速处理。SIMD指令能够
学位
随着计算大量向云端迁移,越来越多的计算工作将在数据中心的服务集群上完成。容器技术契合了以应用为中心的时代的需求,被广泛使用在应用的部署当中。容器技术区别于传统的虚拟机技术,没有虚拟的硬件层,所有容器直接共用宿主机的内核。这种结构给容器带来轻量级、快启动、易迁移等优势,但与此同时,也使得容器不可避免地存在系统资源隔离不彻底的缺陷。所以,提升容器的隔离性一直是业界关注的重点。Linux系统的内核日志属
学位
文本分类是自然语言处理领域中当前学术界和工业界最受关注的前沿问题之一。通用的文本分类算法极大依赖数量充足且类别均衡的数据集,而在实际任务中面对新闻文本数量有限且类别不均衡的情形,文本分类算法效果不佳,鲁棒性较差。此外,由于新闻具有文本风格跨度大、长文本语义丰富且表达方式多样的特点,针对新闻领域的文本分类已成为重大挑战。基于以上问题,提出了层次数据增强和学习方法框架HDAL,并应用于新闻文本分类任务
学位
编译器测试是保证编译器质量的重要手段。现有的编译器测试技术,在测试的过程中都忽略了执行时间过长的测试程序占用了大量测试资源的问题。这里,执行时间过长的测试程序被称为为超时程序。超时程序的执行时间是正常测试程序执行时间的成百上千倍,执行这类超时程序会严重影响编译器的测试效率。同时,在大量的测试程序中,能够触发编译器缺陷的测试程序仅占少数,称为揭错测试程序,执行大量无法触发缺陷的测试程序同样也会导致编
学位
漏洞是各种网络空间安全事件发生的根源。软件的开源化趋势成为主流,安全缺陷随着开源软件的使用和迭代快速传播。为尽早发现并修补漏洞,源代码漏洞检测技术成为研究的热点。基于深度学习的漏洞检测技术可以自主学习漏洞表征生成检测模型,减少了人工的参与,提高漏洞检测的速度和能力。然而,目前软件安全领域缺乏大规模、真实的、有效的漏洞数据集。人工构造的漏洞数据集样本类型简单、特征单一,难以支撑真实软件漏洞检测的研究
学位
儿童脓毒症发病率高、病程发展快,发病机理复杂,在临床上呈现多样化。由于缺乏黄金诊断标准,导致了其早期诊断困难。在传统数据分析难以对高维、复杂线性关系的数据进行有效分析的情况下,可以利用机器学习来进行儿童脓毒症危险因素的识别,以实现早期诊断。针对医疗数据高缺失率、复杂相关性的特点,提出了基于机器学习的特征贡献度评估方法。使用梯度提升树构建分类预测模型,再使用树模型的夏普利加性解释(Tree SHap
学位
<正>习近平总书记在党的二十大报告中指出,全面推进乡村振兴,坚持农业农村优先发展,巩固拓展脱贫攻坚成果。四川省德阳市认真学习领会党的二十大精神,自觉与学懂弄通做实习近平新时代中国特色社会主义思想贯通起来,与深入学习贯彻习近平总书记来川视察时的重要指示精神结合起来,坚持以党建为引领,以产业发展为重点,以人才赋能为关键,加快推进新时代乡村全面振兴,为全面建设社会主义现代化国家夯实广泛而深厚的基础。
期刊
随着人口老龄化问题的加剧,阿尔茨海默症带来的社会问题日益严峻,尽早诊断与干预治疗具有重要的社会意义与经济意义。近年来,基于机器视觉的阿尔茨海默症识别算法发展迅速,但是仍然面临缺乏大规模训练数据集、算法精度不高以及运行效率较低等问题。本研究旨在基于深度学习改进卷积神经网络(CNN),提高阿尔茨海默症预测算法的精度与效率。针对目前2D CNN未能利用MR图像的三维特性,提出一种三方向2D CNN识别网
学位