面对智能分诊的个性化推荐算法

来源 :客联 | 被引量 : 0次 | 上传用户:lyzwrf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】针对电子医疗信息过载和医疗资源严重不足的问题,本文以辅助诊疗的结果为基础,将Skyline查询和局部范围内基于协同过滤的评分方式有机结合,提出了一种面向智能导诊的个性化推荐算法。实验结果表明,本文提出的算法能为用户提供个性化的合理推荐结果。该方法对合理分配和使用医疗资源有很大的促进作用,能从一定程度上缓解就诊压力,提高就诊质量,具有重要的实用价值和社会意义。
  【关键词】辅助诊疗;智能导诊;Skyline查询;医疗推荐;协同过滤;推荐系统
   中国人口数量与医疗资源之间的巨大反差使得医疗资源日趋不足,短期内增加医疗资源的总量几乎是不可能的,因此有效整合和合理分配现有的医疗资源,缓解就诊压力,提升就医质量,有着很大的实用价值与社会意义。智能导诊根据患者的主诉为患者自动推荐相应的医院和医生,对合理分诊起着重要作用。从数据的角度看,智能导诊是针对患者主诉和基本信息对医院和医生的推荐。
  一、相关工作分析
   近年来国内外与医疗领域推荐相关的研究很多,M.L6pez-Nores等[1]引入了一种新的过滤策略, 对于有特定疾病的患者,这种推荐方法的效率较高。徐守坤等提出过一种医生资源均衡推荐算法,使用最佳结果优先的推荐算法,解决了医疗资源的使用过度集中而产生的问题。
  由上述分析可以看出,现行系统主要有两方面的问题:1)没有考虑现在医疗推荐方面最迫切需要解决的问题;2)没有考虑导诊与医疗推荐和传统的推荐在本质上的不同。针对这些问题,本文提出了一种面向智能导诊的个性化推荐算法,其主要有3个特点:1)算法提出了辅助诊疗机制,通过辅助诊疗能根据用户的症状表现,帮助用户大致确定其所患疾病,从而明确用户偏好,提升推荐结果的满意度。2)算法获得用户评分及反馈信息的方式以显式方法为主,并且在辅助诊疗时根据用户的反馈信息对诊断结果进行优化,从而提高诊断结果的准确性。3)提出了一种在有地域约束时的推荐算法。对Skyline查询进行改进,并将其结果作为推荐的候选集合,之后在局部范围内使用基于协同过滤的评分算法,对候选集合进行评分并排序。
  二、整体框架
   首先根据用户的症状表现,使用辅助诊疗算法给出初步诊断结果,再利用反馈信息和症状联想机制进一步确定所患疾病,从而完成症状到用户偏好的转化过程;第2部分是生成推荐结果的过程,由用户的偏好结合其地理位置信息,采用改进的Skyline查询算法,找出一定范围内符合要求的医院作为候选集合,最后在局部范围内由基于协同过滤的评分方式对候选集合中的医院进行评分、排序,从而生成最终的推荐结果。
  三、基于医疗知识库的辅助诊疗技术
  (一)分词与症状索引表的建立
   为了提高分词速度,本文通过对《同义词林》进行适当的改造,构建了一个新的字典。首先,部分无用词汇被剔除;其次,按照词语的字数,字典被分为5个部分,这样每次匹配时词典最多被扫描一次。为了提高分词准确度,本文选用了逆向最大匹配法。为了加快诊断速度,本文采取了在症状信息上建立倒排索引的方法。该索引包含3个属性,分别保存症状分词结果对应的同义词林中的编码、疾病ICD编码和疾病中症状出现的次数,以及症状对应的疾病类型数。后两个属性在进行诊断时使用。
  (二)辅助诊断技术
  1.辅助诊断思路
   辅助诊疗技术采用的核心思想是计算用户输入的症状信息与医疗知识库中疾病症状信息之间的相似度,从而确诊疾病类型,具体实现过程包括:
   1)对录入的症状信息进行分词,使用分词结果在索引表中进行查询,记录所有匹配项,将对应的疾病作为候选集,并将其中的疾病总数记为N。
   2)利用症状索引表计算输入与候选集中每种疾病症状的相似度,并依据相似度进行排序。
  2.相似度计算
   相似度计算公式借鉴了TF-IDF计算相似度的思路,其公式为
  
   式中:S为输入q与疾病症状之间的相似度;numi表示q中的某一症状i在该疾病中出现的次数,当q值较大时,意味着此症状为潜在的主要症状,则提高该症状的权重;numsymptom表示疾病的总症状数,numi对进行归一化,以防止部分疾病系数偏大;typedisease表示症状对应的疾病类型数量,对数函数则是为了提高潜在主要症状的权重。
  四、实验验证
   本文所使用的测试数据来自超星医疗知识库。为了模拟症状表述不全的情况,每种疾病的症状信息都被拆分为两部分。实验在医疗知识库中疾病的 种类数为100和1 000时分别进行了测试。统计实验结果的策略是:如果诊断结果的前10位中出现该疾病,则认为成功召回;如果诊断结果中的前3位中出现该疾病,则认为诊断结果准确。1) 数据库中的疾病种类为100时,选取了10种疾病,共20个测试用例。 2) 数据库中疾病种类为1 000时,选取100种,共200个测试用例,实验结果表明,所选测试数据在此统计策略下,当数据库中疾病种类为100时,召回率为95%,准确率为85%,在优化诊断之后,准确率达到95%,召回率达到100%;当数据库中疾病种类为1000 时,召回率为91.5%,准确率为81%,在优化诊断之后,准确率达到88.5%,召回率达到96%。
  五、总结
   本文通过对医疗与导诊领域的深入研究,发现了医疗领域的推荐与传统推荐在本质上的区别,提出了一種面向智能导诊的个性化推荐算法,以辅助诊疗结果为基础,将Skyline查询和局部范围内基于协同过滤的评分方式相结合。本文中提出的算法和思路对于有效地利用电子医疗数据,合理分配和使用现有的医疗资源,缓解就诊压力,提升就医质量意义重大,有着很大的实用价值与社会意义。
  【参考文献】
  [1]LOPEZ-NORES M,BLANCO-FERNANDEZ Y,PAZOS-ARIAS J J,et al. Property-based collaborative filtering for health-aware recommender systems[C]//Proceedings of 2011 IEEE International Conference on Consumer Electronics. Las Vegas,NV,USA,2011.
  [2]GONG Jibing, WANG Lili, SUN Shengtao, et al. iBole: a hybrid multi-layer architecture for doctor recommendation in medical social networks[J]. Journal of computer science and technology, 2015, 30(5): 1073-1081.
  [3]徐守坤,吴伟伟.基于语义的医疗资源均衡推荐算法J]. 计算机工程, 2015, 41(9): 74-79.
  [4]侯梦薇, 卫荣, 樊林,等. 推荐系统在医疗领域的处理模型及应用研究[J]. 中国数字医学, 2019, 14(01):85-87.
其他文献
【摘 要】随着大数据、云计算等新一代技术的兴起,推动了中小企业财务会计与互联网技术相融合,加快财务信息化的发展步伐。大数据正影响着中小企业,慢慢颠覆过去的财务会计管理模式、方法和理念,给中小企业带来了诸多潜在的机遇和挑战。传统的财务电算化工作模式已逐渐过时,不能适应新时代的经济增长需求。面对挑战,中小企业应如何适应大数据时代的步伐,运用财务会计信息化技术实现可持续发展?本文通过探究大数据背景下中小
期刊
【摘 要】电商产业园主要就是集中一批电商企业,鼓励企业进行集约发展,通过全面完善相应的产业链和供应链来全面提高这些企业的综合经济收益。电商产业园区是城市经济发展的特殊经济区位,对于促进经济发展有着重要的作用。建设电商产业园区对于促进区域经济发展有着十分重要的作用,为进一步推动电商产业的快速发展,就需要进一步深刻认识到电商产业园区在促进区域经济发展中的重要作用。本文从电商产业园区的概念和特点展开分析
期刊
【摘 要】随着经济的快速发展,集团企业的发展规模越来越大,为了能更好的控制子公司的财务,财务共享服务理念受到集团企业的追捧。共享模式的运用不但可以降低运营成本,也可以加强公司财务管理。但我国财务共享起步较晚,在发展的过程中面临许多问题,如何才能更好的利用好财务共享模式,加强集团企业对子公司的财务管控,是值得我们进行探讨的课题。  【关键词】财务共享;模式分析;集团  一、引言   财务共享是企业
期刊
【摘 要】海外并购是一个企业打开国际市场、优化资源配置,吸收先进技术,最有用的方式,就是扩大资本规模,现如今处于经济全球化,政府对企业进行狠抓、紧抓“走出去”的国家战略,基于此背景,选择跨国投资的中国企业呈现迅速增長的趋势。但是在学术界,在企业进行海外并购对企业财务风险的影响方面,一直众说纷纭,有人认为海外并购对企业的财务财务风险没有影响,也有人认为海外并购可以增加企业的财务风险,当然还有人认为海
期刊
【摘 要】近年来智能手机和互联网的飞速发展给人们带来了巨大的改变,也给电商网红们带来了全新的机会,随着微博、抖音等社交平台的广泛传播,网络红人不再是一个陌生的词汇,有人的地方就有网红,有了网红就有网红经济。本文是以网红经济这一社会新生现象为研究对象,致力厘清网红经济产生背景和发展方式,研究的目的在于分析在当下的时代环境下,网红如何实现经济效益以及可持续发展。  【关键词】网红经济;变现;可持续发展
期刊
【摘 要】泥浆是石油钻井过程中,孔内使用的循环冲洗介质。泥浆是钻井的血液,又称钻孔冲洗液。钻井液按组成成分可分为清水、泥浆、无粘土相冲洗液、乳状液、泡沫和压缩空气等。清水是使用最早的钻井液,无需处理,使用方便。对于石油工程钻井企业而言,应该选择水质较好的泥浆配置用水,提升泥浆的性能,确保泥浆作用的充分发挥,推动钻井施工的顺利进行。  【关键词】石油工程;钻井施工;泥浆;水质;配置;影响   泥浆
期刊
【摘 要】随着人们的生活节奏不断加快,人们对方便即食食品的需求也不断增加,以擂茶粥作为项目实施的主要对象,因其符合制作冲调性方便粥的这一需求,且其口味和营养结构更为合理,迎合了消费者养生的需求。项目在实践过程中,根据擂茶粥产品特色以及消费者需求偏好,对擂茶粥进行口味研发以及吃法的多样化创新,在产品的保存方法上也不断改良升级,做到“原生态,无添加”,向消费者提供一个安全无负担的产品。  【关键词】擂
期刊
【摘 要】重大突發事件使政府面临着极大的挑战,对政府的管理与领导能力提出了更高的要求。我国是典型的集权式国家,澳大利亚是典型的分权式国家,笔者以2019年澳大利亚山火澳洲政府的举措与2019新冠肺炎疫情中国政府的举措为例,对比分析二者的应急响应模式及其主要差异。  【关键词】集权与分权;重大突发事件;应急响应模式;2019澳大利亚山火;2019新型冠状肺炎  Comparison of centr
期刊
【摘 要】随着我国经济的发展,社会需求的增多,建筑工程项目越来越多。建筑工程项目的获利与实际施工都与工程造价有着巨大的关系。建筑工程造价成本控制是建筑企业开展成本管理工作中重要的组成部分,它直接影响其工程经济效益。本文阐述了建筑工程造价的含义及作用,探讨了建筑工程中工程造价及成本控制。  【关键词】建筑工程;成本控制;工程造价   工程造价,是指工程建设中所预期开支或者实际开支的所有固定资产的投
期刊
【摘 要】加油站便利店业务在未来不但是加油站的一个利润增长点,而且是销售公司进行服务升级、培养消费者忠诚度的有力手段。这就要求开展便利店等非油品业务的加油站狠抓营运管理水平,用较高的营运管理,来提高自己在油品这一同质化市场里面的竞争力  【关键词】加油站;便利店;营运管理;思考   加油站便利店业务在未来不但是加油站的一个利润增长点,而且是销售公司进行服务升级、培养消费者忠诚度的有力手段。这就要
期刊