基于深度神经网络的中文医疗社区问答匹配技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:gbqangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通信技术的发展,越来越多的人在面对健康问题时会通过手机、电脑等电子设备在互联网上搜索相关问题。针对这一现象,各大医疗平台纷纷开发了多个在线医疗问答社区平台,但是面对着越来越多的健康问题,医生的资源是有限的,因此如何通过分析现有的医疗健康问答数据来快速自动回答患者所提出的问题是一个关键的问题。针对这个问题,医疗问题答案如何正确选择是构建自动医疗问答系统的关键内容,因此我们研究了一系列方法尝试从众多候选答案中找出与问题相对应的准确答案。本文主要研究了中文医疗健康领域的问答匹配问题,主要包括两个关键问题:1.如何将文本信息准确的表示为计算机可以处理的向量形式。2.如何构建神经网络模型可以在文本的向量表示中准确捕捉其中的语义信息。针对第一个问题,我们尝试了“分词”与“分字”两种文本表示方法,发现针对中文医疗领域由于目前的分词工具分词的不准确性,直接表示为字向量的方式既可以减少表示矩阵的维度,减少内存和计算需求,还可以提高最终模型的准确率。针对第二个问题,首先我们验证了传统的CNN、RNN以及其变种LSTM与BiGRU神经网络模型在cMedQA、cMedQA2数据集上的问答匹配性能,分析了不同模型的优缺点。然后将多种神经网络模型相结合构建多尺度卷积神经网络模型与BiGRU-CNN模型,验证不同组合模型在多个数据集上的性能,分析不同组合模型的特点。为了进一步评估与提高医疗问答领域问答匹配模型的准确率与泛化能力,我们利用爬虫技术收集了多个医疗健康网站的医疗问答数据,构建了据我们所知目前最大的中文医疗健康问答数据集cMQA,并在上面验证了上述提到的模型。最后将注意力池化与传统神经网络模型相结合构建新的组合模型BiGRUATT与BiGRU-CNN-ATT,验证不同注意力池化组合模型在多个数据集上的性能,证明了引入注意力池化机制后模型的准确率有了一定程度的提升,为构建自动医疗问答系统提供了一定的理论与算法支持。
其他文献
本文从地方电力企业人力资源管理的现状入手,结合地方电力企业人力资源管理和总存在的问题提出了一些对策,笔者认为,地方电力企业的人力资源管理要打破现有的人力资源管理体制,树
2001年12月中国加入世界贸易组织之後,中国政府开始有系统地修改其外商投资法律、法规,以实现其加入世贸组织时所做的承诺,达到世界贸易组织的要求。有人将之称为“世贸变法”。
目的:通过临床对照观察,探讨醒脾消积推拿法联合神曲消食口服液治疗小儿积滞(脾虚夹积型)疗效的确切性。方法:选取于2019年1月—2019年12月到黑龙江中医药大学附属第一医院儿
虾青素(Astaxanthin),化学名称为3,3’-二羟基-4,4’-二酮基-β,β’-胡萝卜素,是一种非维生素A源的酮式类胡萝卜素,具有抗氧化、抗衰老、防辐射、增强免疫力等作用,在食品添加
学位
<正> 2002年6月11日最高人民法院审判委员会第1225次会议通过了《最高人民法院关于向外国公司送达司法文书能否向其驻华代表机构送达并适用留置送达问题的批复》(以下简称《
工笔画是水墨画得以产生的艺术基础,水墨画从工笔画中走来,它的艺术审美思想,理论基础,造型原则都出自工笔画,其艺术表现技法也是从工笔画基础上发展而出.如果离开了工笔画的
在云计算环境中,合理的虚拟机分配策略是提高云计算系统性能并且降低能耗的关键技术之一。云计算技术的快速发展,使用户可以不限时间、地点方便的获取与使用计算机资源,然而,
排水工程专项规划主要包括雨水系统规划、污水系统规划,是进行城市基础设施建设和保障城市雨、污系统正常运行的重要依据。本研究前期通过对湘潭经开区雨水、污水管网实况调
2000年10月北京市第二中级人民法院知识产权庭正式受理了原告北京金融城网络有限公司(以下简称金融城公司)诉被告成都财智软件有限公司(以下简称财智公司)侵害着作权及不正当