文本病历信息抽取方法研究

被引量 : 0次 | 上传用户:wujie1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从文本病历中自动提取重要关联信息服务于临床决策、数据挖掘等各类临床信息系统,是当前临床信息化亟需的基础技术。由于自然语言表述的灵活性,信息自动提取涉及领域知识、语法知识和计算方法等多个方面的交叉,是医学语言处理研究的主要挑战。本论文在借鉴和吸收英文环境下的医学语言处理研究成果的基础上,探索性地提出一套中文文本病历信息抽取方法。该方法发挥了机器学习方法的适应性优势和基于语义的语法解析方法的准确性优势,并针对家族史结构化提取这个具有显著临床意义的问题进行验证。另外,本论文还结合各类医学信息标准和常用表示方案,提出了适用于本研究的病历信息表示方案。文本病历信息提取技术的成功,将克服临床决策支持、临床路径管理等前沿医疗信息技术发展所面临的诸多瓶颈问题,提升我国医疗信息技术产业的核心竞争力,具有显著的社会和经济效益。本论文主要从以下几个方面开展工作:首先,回顾医学语言处理技术新发展及其临床应用,分析中英文医学语言处理的相似性和特异性,进而总结英文医学语言处理值得中文借鉴的部分。其次,由于中文医学术语库的规模小、覆盖率低,论文将侧重使用基于统计学的机器学习方法来解决医学问题自动识别问题。然后,由于句法语料库的建立需要更加专业的语言学知识并且本论文的句子处理对象相对简单,论文将使用简单模式匹配的方法提取重要信息间的关系。最后,以家族史为例,验证文本病历信息抽取方法的有效性。
其他文献
高职院校毕业生就业评估可以反映一所高职院校教育教学质量和管理水平,为评价学校办学水平提供了一个重要的风向标,有利于促进学校对学生开展全方位的就业服务。根据现行评估工
传统班级授课制教学所具有的标准化、统一化、同步化的特点,难以顾及学生的个体差异。学科分层走班教学就是将学生的个体差异视为一种可资开发利用的教育资源而展开的优化传
结合北一区断西三元复合驱试验进展及效果 ,分析了三元复合驱过程中窜流和结垢对试验的影响 ,在提高三元复合驱开采效果配套技术方面取得了一些认识 ,并提出了下步研究方向
耳塞由多种材质制成,功能各不相同,怎样正确使用,可能许多消费者并不了解,下面为读者介绍鉴别耳塞的简单方法。
反义词是词汇系统中相当活跃,表现力比较强的部分。《论语》的语言深刻隽永,对后代语言的发展有深刻的影响。反义词在《论语》中有比较多的运用,对语义的表达起到了很好的修辞作
根据科式惯性力产生原理的基本公式F_c=2mv_rω,设计了一套机械式角速度传感器装置。仪器固连在作定轴转动的构件上,同时仪器内部构件作相对直线往复平移运动,引起了两侧贴有
现代产业体系是一个地区经济发展水平和综合实力的重要标志。从产业发展角度看,现代化的过程就是在科技进步的推动下,经济不断发展、产业结构逐步优化升级的过程。发展现代产
<正>新药研发是一个漫长而复杂的多程序过程。先导化合物要成为可用于临床试验的候选药物,必须深入了解其在生物体内的吸收、分布、代谢和排泄性质,这一环节贯穿于药物研发的
一、引言 今日世界上有几百万台计算机在工作,应用在科研、生产、管理和社会生活的各个方面;计算机、机器人和文字处理机正在产生巨大而深刻的历史性的影响。 随着计算机的高
本文主要介绍几种新型的微通道板(MCP)。同时简单叙述采用热烘烤和紫外光照射清洗技术对MCP进行真空处理的工艺研究过程和结果,采用这种MCP作为电子倍增器的光电倍增管,其性能稳定,寿命达1000h以