基于CNN模型的在线健康社区医疗专家推荐研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:dreamagain1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国的疾病年轻化,就医人口在1990年到2000年短短10年由6299万增加至8811万,增加了2512万人,占总人口的比例也由5.57%上升为6.96%,就医人口正以每年5%的速度增加,到2040年将增加到7400多万人。由于疾病年轻化越来越严重,中国人口就医人数越来越多,随之带来的就医资源需求就越来越大。社会的发展以及环境的变化和人们生活水平的提高,导致对医疗服务的需求也在不断增长,医疗资源紧缺,有限的医疗资源不能较好的使用在合适的地方。为了应对庞大的就诊需求,提升广大群众就医效率和就诊体验,降低网上就医时间和缓解就诊压力,避免患者提出的就诊问题得不到及时答复导致延误患者病情等问题。因此,急需建立一种医生与患者之间的关联,通过“问题—医生”的专家推荐方法来缓解巨大的医疗卫生需求。针对以上问题,本文开展了一系列关于医疗专家推荐模型的相关理论和实验研究。本文采用卷积神经网络方法对在线健康社区医疗专家进行推荐,开展的主要工作内容如下:(1)获取在线健康社区医疗文本数据集并对数据集进行预处理,在以往研究中主要采用处理起来相对容易的结构化文本,但是该种数据的数据量较少。本文采用爬虫工具爬取2017,2018,2019共三年的医患问答数据,数据为非结构化文本,数据处理难度相对较大。本文通过对在线医疗社区医疗文本数据集的研究,挖掘其主要特征为后续模型构建和实验研究及后续改进提供理论支持。(2)构建了基于卷积神经网络的在线健康社区医疗专家推荐模型,对推荐系统神经网络模型进行实验研究,建立了基于CNN网络的在线医疗专家推荐模型,给出模型的四个卷积层的参数以及2个全连接层和输出层的参数,完成了卷积神经网络结构设计。(3)在理论研究的基础之上,完成实验平台的搭建以及对模型的训练与测试过程,采用MSE值、解决数据稀疏性问题能力、召回率、准确率以及loss和accuracy曲线等评价指标完成对模型的评价,通过模型参数优化,以及增加卷积层和池化层的方法进行优化研究,优化后的模型的准确率、召回率以及F1值都比未改进之前有明显的提升,平均召回率在65%以上,相比没优化之前均提升在20%以上,当迭代次数达到10000次的时候,损失误差值可以降到0.119以内,函数已经接近收敛,说明该模型在训练过程中可以达到要求;测试损失误差在最终稳定在0.45附近,测试精度最后达到88以上,表明该模型具有较高的推荐精度。(4)在推荐系统中引入医生的职称、是否为三甲医院以及年龄要求等上下文信息,上下文信息的加入使得推荐精度有了明显提高,构建了基于上下文信息的在线健康专家医疗推荐系统。通过论文研究,论文的主要贡献如下:(1)本文基于卷积神经网络理论,从患者病情信息、医疗专家特长信息的特征数据着手,通过建立基于卷积神经网络的医疗专家推荐模型对具体健康问题进行医疗专家推荐,将专家的擅长领域与病人的问题结合在一起进行推荐,该方法属于“一对一”的服务模式,具有智能、精准、高效的特征,可以大大缩减医患沟通时长,快速建立医患关系,提高了专家推荐的准确度,改进了社区医疗体系,提升了用户体验,目前在该领域研究较少。该系统推荐的医生与患者病情之间具有较高的匹配度,能够高质量的完成线上诊疗问题。同时,提高了医生诊治效率,对缓解巨大的医疗卫生需求具有十分广阔的应用前景。(2)在推荐系统推荐的过程中,以往的医疗专家推荐系统没有考虑医生职称、是否为三甲医院以及对医生的年龄要求等上下文信息。本文所描述的推荐系统加入了医生的职称、是否为三甲医院以及年龄要求作为推荐系统的上下文信息,上下文信息的加入使得推荐精度有了明显提高,构建了基于上下文信息的在线健康专家医疗推荐系统。(3)对在线医疗专家实验过程中,本文通过理论与实验相结合,对四种模型进行了研究,经过对比选择,进行了MSE值的分析,不同稀疏度下的对比实验,选出优选模型,并对优选模型进行参数优化,增加一个卷积层和一个池化层,此种优化方法取得了较好的效果。
其他文献
新冠疫情的爆发打乱了人们原本平静的生活,也影响到了整个社会的正常运行。在疫情的笼罩下,人们的情绪会随着疫情发展的最新动态而不断变化。随着互联网的发展和智能手机的普及,人们倾向于在网络社交平台上发表自己对于热点时事的看法,而这些文本中往往包含着某种情感倾向。及时把握社会对于疫情的情感走向对于舆论引导至关重要,而如何通过这些文本数据准确地识别出其中的情感是我们亟需解决的问题。由于中文的表达方式复杂多变
学位
在全世界气候日趋变暖和能源安全问题日益突出的大环境下,具备节能环保特性的新能源汽车在全球范围内不可避免地成为了汽车工业的主流发展方向。为顺利推广新能源汽车,我国政府从宣传、购车到使用环节分别颁布了宣传政策、购车政策、路权政策、充电政策这一系列新能源汽车激励政策。上海作为首批新能源汽车推广试点城市和发展私人新能源汽车市场的前沿试点城市,在新能源汽车推广上取得了一定的成效。上海市也就本地基本情况因地制
学位
水资源是人类生存和发展必不可少的自然资源。我国虽然水资源总量丰富,但是人均水资源量处于世界靠后位置,是世界上人均水资源贫乏的国家之一。与此同时,我国水资源空间分布不均,东南多西北少,这使得缺水地区的水资源短缺问题更为严峻。习近平总书记在十九大报告中指出:“生态文明是中华民族永续发展的千年大计。必须树立绿水青山就是金山银山的理念,坚持节约资源和保护环境的基本国策。”2016年水资源税率先于河北实施试
学位
混合所有制改革是我国国有企业改革的顶层设计和主要方向,多种资本交叉持股、互相制衡,不仅优化了企业股权结构,而且有利于缓解国有控股股东“一股独大”的现象。非国有资本的引入使非国有股东积极参与公司治理,在一定程度上解决了其固有的弊端,激发了国有企业的活力与创新能力。中共十九大之后,我国进入经济发展的“新常态”时期,不仅追求经济发展的速度,而且注重经济发展的高质量。创新成为驱动发展,推动经济高质量持续增
学位
债券融资我国企业最重要的外部融资方式之一,探究债券融资成本的影响因素是一直以来学者极为重视的研究领域。在以往的研究中学者大多从宏观因素、公司原生的公司特征、债券设计这三方面出发研究债券融资成本的影响因素。然而事实上,公司特殊的股东背景也会对公司的融资环境产生一定影响,进而影响债券融资成本。风险投资作为区别于传统机构投资的权益投资形式,自1998年在我国发展起来后就对我国企业上市前经营管理以及上市后
学位
随着用户市场和营销环境的变化,车企会对产品做出适时调整以完善产品设计、满足新的需求。汽车改款和换代是调整的主要方式,汽车换代是对车型的重新设计和制造,汽车改款是对车型配置等方面进行改良。汽车的更新换代往往会作为车型的新卖点,同时也将掀起舆论风波,引发市场对汽车厂商相应更改的讨论,有效把握舆情事件、跟踪舆情走势对于车企来说至关重要。我们的研究始于别克英朗三缸发动机的切换事件。2010年初,以注重品质
学位
随着移动互联网的飞速发展与电子商务市场的不断扩大,许多大型电商平台的产品数量也呈现爆炸式地增长。为了帮助用户检索选购与商家经营管理,需要对产品进行科学合理的分类。目前平台常用的方法是人工分类法,由平台专家构建一个产品层次类别树状体系,当商家上架产品时根据自身对于产品与分类树的理解将产品归置到分类树的一个或多个叶子节点上。然而,人工分类方法需要耗费大量的人力物力成本,而且由于商家对平台分类体系以及商
学位
在企业运营环境快速变化,产品迭代速度加快的今天,互联网广告被企业广泛应用于产品营销过程中,特别是在新产品上市时期,广告宣传作为一种重要的营销手段能够向潜在客户提供产品信息,促进消费者产生购买兴趣从而使企业获取更高的收益。为了控制投入成本,企业通常会对一个销售期内的广告预算和可用产品库存进行限制,因此在库存限制下制定有效的广告预算分配策略对于企业决策至关重要。传统的收益管理研究中通常假设营销商已知顾
学位
高中阶段的数学教学更注重学生综合能力的培养。因此,传统的教学方式已经不能满足高中学生数学学习的需要,引入与培养诉求高度一致的元认知策略既是需求也是要求。本文对元认知策略进行了简单描述,从高中数学教学现状及元认知策略引入高中数学后的教学改善两个方面进行了研究阐述,意在让元认知策略真正服务于高中数学教学,提高学科教学质量的同时,实现人才培养的目标。
期刊
上证50ETF期权于2015年2月9日在上交所挂牌,是我国境内首个上市交易的期权产品。随着我国期权市场的逐步发展,市场参与者在数量上也逐步提升,期权成交量大体呈逐年上升趋势,体量可观。在这个背景下,投资者受市场信息和波动风险的影响越来越突出,人们对期权投资框架的认知需求与日俱增。探讨上证50ETF期权规律,挖掘中国期权特点,并逐步深入对期权的风险、投资策略的研究,发现其中值得进一步探究的地方是非常
学位