基于命名实体识别技术的药物推荐模型应用研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:zsx08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国人口众多的基本国情并未发生改变,同时,我国现有医疗人员并不能满足人们的日常生活需要。特别是在新冠肺炎疫情的影 响下,由于大量医疗人员都投身于新冠肺炎疫情的防控和治疗工作当中,使得非新冠肺炎患者就医难的问题显得更加突出。此外,药物推荐一直是医疗实践应用中常见的智能医疗手段,作为临床决策的一种,药物推荐主要是依靠大量的患者电子病历、医疗文献等知识库为基础,通过给出药物的种类、用药方式和剂量来辅助医生做出决策。现流行的药物推荐本质上是专家系统,只是对相应文本制定规则进行简单匹配,虽然在一定程度上可以辅助医生做出决策,但由于知识的复杂性和模糊性使得实际应用效果并不理想。同时,研读现有论文发现,少有人对药物说明书的信息充分利用。无论是医生还是患者,都离不开药物说明书的使用。充分挖掘药物说明书的信息,无疑是药物正确使用的首要步骤。融合药物说明书数据和患者诊断数据进行药物推荐既丰富了药物推荐的数据来源,提升了药物推荐效果,同时为药物说明书这样有特殊行文规范的文本类数据提取关键信息提出了新思路。此外,相较于在较短时间内提升医生平均知识水平和经验水平来说,让计算机习得根据患者病情来推荐药物更现实可靠,同时可以辅助医生进行药物调整,这有巨大的潜在社会价值和经济价值。本文在前人的研究基础上,借助某智能医疗公司提供的药物说明书实体标注数据和患者诊断数据搭建了药物推荐模型。首先,对药物说明书进行了词频分析,通过比较全文词频和不同实体类别的词频,发现对患者用药有重要帮助的关键信息仅占全文内容的5.22%。针对此类数据的信息分布特点提出利用命名实体识别技术提取药物说明书的重要实体作为药物说明书的关键词信息,在此环节通过对比CRF、LSTM、BERT及其常见组合模型的实体分类预测效果,针对不同实体类别选择其合适的命名实体识别模型,并对药物说明书所提取的相关实体进行汇总整理,为药物推荐提供数据支持。接着,对于处理好的药物说明书数据和患者诊断数据,通过分析实际用药情况制定不同的推荐策略,同时比较了不同策略下不同药物备选个数的药物推荐效果,据此选择出药物推荐效果最好的推荐策略及其适合的推荐药物个数来搭建最终药物推荐模型。本文在以下几个方面实现了创新。第一,本文采用的推荐模型在患者就医以及疫情防控中具有较强的实用价值,从选题上以及解决问题的视角上符合当下社会现状,有效缓解医生的压力,为患者就医提供有效帮助。第二,本文在药物推荐中引入了药物的相关信息数据,与现有推荐模型相比,在数据来源方面更加完善,既有效利用了患者信息,也结合了药物信息。第三,本文采用的推荐模型充分考虑了药物的适用性与患者的安全性,在进行药物推荐时先过滤了会对患者产生不良反应的药物,通过比较不同推荐策略,选出最佳的药物推荐模型,提升了模型效果。经过实证分析本文得到以下结论。第一,利用命名实体识别提取药物特征能显著提升药物推荐效果,相较于传统TF-IDF提取关键词的药物推荐准确率提升了 5.24%,召回率提升了 37.68%。第二,命名实体识别过程中针对不同类别实体采用不同的分类模型有效提升了实体识别的效果,不同实体选择不同模型可使准确率提升0.82%,召回率提升1.36%。第三,通过比较不同推荐策略对药物推荐效果的影响发现,利用患者特征来匹配药物特征可以有效提升药物推荐效果。第四,命名实体识别过程中BERT-BILSTM-CRF模型对于不同实体类别的分类效果都是最优或者接近最优的。
其他文献
第四次科技革命推动着生产力变革和社会发展,催动了数字化时代的到来。联合国秘书长安东尼奥·古特雷斯指出“疫情后世界格局将与以往不同,会更加数字化,未来的方向是应对全球挑战和实现可持续发展的新数字常态”。作为数字中国体系的组成部分,政府数字化转型发展是加速数字经济建设和推动数字社会进步的基础性工程。推动政府数字化转型是落实网络强国战略和实现数字中国建设目标的关键。省会城市政府具有推动政府形态变革的内生
学位
随着经济社会和城市化进程的不断加快,“垃圾围城”成为我国面临的民生难题,传统处理方式已经不能破解其所面临的困境,因此,城市生活垃圾分类管理作为我国生态文明建设的重要组成部分,成为改善民生和可持续发展的重要议题,是坚持绿色发展和高质量发展、实现资源循环化、践行“绿水青山就是金山银山”理念的重要举措,对于推进城市生活垃圾资源化、减量化和无害化具有重要意义。党的十八大以来,中央政府领导不断优化完善法制治
学位
声带是发声的主要器官,声带良好的发声功能主要来源于声带的良好且规律的振动。声带振动是一种高速、复杂而精细的运动,平均每秒振动高达100~400次,研究声带振动功能对于诊断、评估不同嗓音障碍疾病,揭示声带振动机理,寻找异常振动的病因具有重要意义。发声时,声带规律而周期性的振动是正常发声过程的重要部分,声带振动特性对声带解剖结构细微变化、相关肌肉功能障碍和声门下压力的变化高度敏感,通常表现为双侧声带振
学位
化石能源的使用加速全球气候变暖,21世纪以来,我国成为全球碳排放量最大的国家,节碳减排势在必行。长江经济带是我国核心经济带,对我国区域发展和环境保护具有较大影响力。分析该经济带碳排放时空演变特征,探索碳排放的影响因素及空间效应有助于实现该区域低碳发展目标,为我国低碳发展战略的制定提供参考。本文以2003-2019年省级能耗数据为基础,对省级尺度碳排放量进行测算,基于测算结果及夜间灯光数据构建碳排放
学位
股市一直是中国经济市场的重要组成部分,备受政府和股票投资人的广泛关注。历经了三十余年的发展,中国的证券市场已从无到有,并逐渐发展成一套相对完善的市场系统。股票价格的正确预测能够带动金融市场的稳定运转,也能够使投资人最大限度的回避风险,并采取最合理的投资决策,以便获取最高利润。作为金融产业的重要板块,医药类上市股份公司在国民股市中的地位也日益重要,自2020年以来,随着全球新冠疫情的大爆发,全世界的
学位
均压电极是高压直流输电工程换流阀内冷水系统的重要部件,起到钳制电势和减小泄漏电流的关键作用,但是在运行过程中,均压电极发生腐蚀或者断裂,将导致换流阀阀塔上与内冷水管道接触的金属器件发生腐蚀,内冷水系统发生渗漏、堵塞等,从而使得换流站因设备过热、水管漏水等问题造成的停运事件屡有发生,严重影响直流工程的安全稳定运行。因此,研究均压电极断裂相关机理和原因能够有效减小内冷水系统事故。文中通过分析均压电极在
期刊
背景和研究目的原发性肝癌(primary hepatic carcinoma;PHC)仍是中国癌症相关死亡的主要原因之一。早期发现和诊断可能会增加治愈PHC的可能性,改善预后,提高生存质量和减轻疾病负担。动态监测甲胎蛋白(alpha-fetoprotein;AFP)水平可以作为早期发现AFP阳性原发性肝癌(APHC)的观察指标。但是,由于各种原因,大多数患有慢性肝病的人无法定期检测AFP水平。此前
学位
背景和目的:FFAR2和FFAR3可被短链脂肪酸激活,调控多种炎症和免疫反应。短链脂肪酸受体在炎症性肠病中的作用已在动物实验中得到了大量的研究。本研究旨在探讨FFAR2、FFAR3在炎症性肠病患者肠道粘膜组织中的表达水平及其与疾病严重程度的相关性,以便更深入地探究IBD的发病机制,为IBD的治疗提供潜在的靶点。方法:本研究首先从GEO数据库下载芯片GSE94648(健康组22例,IBD组75例),
学位
目的:(1)检测肝癌患者血浆中tp53诱导的糖酵解和凋亡调节蛋白(TIGAR)含量与对照组血浆TIGAR含量的差异。(2)检测肝癌组织与癌旁组织中TIGAR及磷酸果糖激酶-3(PFKFB3)表达的含量差异,以及TIGAR与PFKFB3在肝癌组织与癌旁组织表达的关联性。(3)检测肝癌组织与癌旁组织中TIGAR及血管内皮标记物(CD31)的含量差异,以及TIGAR与CD31在肝癌组织与癌旁组织表达的关
学位
能源是社会生产活动至关重要的物质基础,也是决定经济稳健发展的关键要素。能源是否充足、能源是否得以充分利用,在很大程度上影响了经济建设质量。然而,能源的不可再生性和工业化发展前期的资源大量开采,使得能源总量大幅减少,阻碍了经济的可持续发展。与此同时,频频爆发的极端天气事件和自然灾害,也使得人们开始正视能源产出问题,并开始探索出更合理、更符合经济发展规律的能源利用模式。新能源的出现极大缓解了新时代下的
学位