面向医疗语义理解的结构化处理方法的研究与实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:sakurabb1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能热潮的掀起,人工智能在医疗健康领域的应用场景也越来越丰富,人工智能技术影响着医疗行业的发展。在一些检查中,医生双手无法离开检查设备,亟需引入智能化的语音交互医疗产品来协助工作,提升工作效率。在智能化语音助手中语义理解引擎起着核心作用,医疗语义理解的含义是帮助语音助手进行理解医生的意图、提取医生说话内容的关键信息,并对获取的文本信息进行结构化处理,最终生成电子病历。蓬勃发展的背后,人工智能在医疗领域的应用和推广也面临着诸多问题和挑战。目前针对中文自然语言的医疗文本结构化处理方法采用的方案是存在较多的弊端:灵活性不足、无法实现各种业务的定制化、容易丢失重要病历信息等等。针对以上存在的问题,本文主要从以下几个方面开展工作:本文基于科大讯飞有限公司智慧医疗内核部门“面向医疗语义理解引擎”项目,对语音转写文本进行结构化处理的研究。本文通过对语音转写文本数据以及需求进行深入的分析,给出了一个“规则+命名实体识别+知识库+分类”一体化的医疗文本结构化处理方案。首先,针对目前传统信息提取技术应用于本课题中效果较差的问题,本文给出了一种基于规则和命名实体识别融合的信息抽取处理方法,该方法进行NLP(Natural Language Processing,自然语言处理)文法解析和命名实体识别的提取,并保留提取信息的并集。其次,针对传统医疗文本结构化中知识图谱的应用只是实体间语义的简单拼接,结构化效果较差的问题,因此本文引入知识图谱校验思路。其方法是在医疗知识图谱构建完成后,对结构化系统中提取的语义信息进行合法性校验,包括值类型、值范围、以及语义关系等,以提高文本结构化的正确率。然后,为防止文本中有用信息丢失,本文给出了一种基于CNN(Convolutional Neural Networks,卷积神经网络)分类模型对文本进行二分类的方法,并对其中CNN模型结构进行了改良。经过实验对比分析,最后选用jieba分词和CNN组合的方案对文本进行二分类。最后,通过对前面三个主要部分的研究,设计和实现了面向语义理解的结构化处理方案。通过真实的现场语音转写文本数据验证改进后的系统在结构化效果以及分类效果有较大提升。
其他文献
目的:探讨自身免疫因素与不育的关系.方法:检测165例不育女性患者血清As-Ab、EM-Ab及ANA阳性率.结果:不育女性患者As-Ab、EM-Ab及ANA阳性率均显著高于对照组(P<0.01).结论:不
随着消费量的不断增长,我国石油对外依存度不断上升。2009年5月我国《石油价格管理办法(试行)》出台,以期获得国内成品油定价与国际原油价格接轨,文章通过构建线性回归模型,针对国
目的 探讨无针密闭式留置针输液装置在急诊科的应用效果。方法 随机选取400例急诊急救患者分为实验组(n=200)和对照组(n=200),分别使用安全型密闭式留置针带分隔膜接头和普通静脉
酚酞不溶于水的性质对用分光光度法测定β-环糊精的含量有一定影响,本实验研究了酚酞显色液吸光度变化的规律,提出了一种改进的分光光度法进行β-环糊精含量的测定,能保证吸光度差
目的:分析肾上腺神经节细胞瘤的影像表现特点,提高对肾上腺疾病影像诊断的认识。方法:收集手术病理证实的13例肾上腺神经节细胞瘤的CT、MRI资料,回顾性分析病灶的影像特点并与组
十四世纪兴起的明王朝,经历了人类历史上航海事业的巅峰时代,遭遇了西方资本主义狂潮的最初冲击,面临着世界历史平衡被打破的前所未有的局面。在世界交通史上这一关键时期到
分析制浆造纸过程中酚类物质产生的真实原因,以便于造纸企业有效地采取控制措施,减轻水污染.
随着人们对电子产品的依赖性逐渐增加,大街上举着太阳伞低着头在烈日下使用电子产品的人随处可见,占满的双手已经不能再携带笨重的移动电源了。基于上述问题,文章设计了一种
为研究不同蜜源的蜂蜜挥发性成分的差异性,采用同时蒸馏萃取法对5种蜂蜜挥发性成分进行提取,对提取液进行GC—MS分析。5种蜂蜜中共鉴定出25种化合物,其挥发性成分组成及含量差异
在我国现代经济体系下,房地产是支柱性产业,发挥着"牵一发而动全身"的作用。随着我国经济发展逐渐进入新常态,中国房地产市场呈现出了新的特征,受到多种经济因素的影响,其中既