病历信息抽取方法的研究与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:qxy489354518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息爆炸带来的严重挑战,信息抽取作为快速获取重要信息的自动化工具被应用于多个领域。在生物医学领域,随着电子病历和临床决策支持系统的发展,如何从电子病历中自动提取信息并服务于临床决策,是当下医疗信息化亟需解决的问题之一。本文致力于研究如何将信息抽取相关技术应用于文本病历中,探索针对特定内容的信息抽取方法,为完整病历的信息抽取累积经验。随着信息抽取技术在病历中的成功应用,病历结构化、案例库和临床数据仓库构建、知识获取等多种问题将迎刃而解,最终实现电子病历与临床决策的集成。   本文在借鉴现有成果的基础上,提出了一套相对完整的信息抽取方法,实现了既往史中病症相关信息的抽取。整个抽取过程分为命名实体识别、模板抽取和填充两个阶段。在命名实体识别阶段,通过比较现有的实体识别方法和模型,采用了“词典和规则相结合”以及“词典和机器学习相结合”两种方法对中文病历中最常见的几类实体进行智能识别以弥补单一识别方法所固有的缺陷,取得了比较理想的识别效果。在机器学习的方法中,本文通过实验逐步分析语言符号、词性、构词特征等多种特征对实体识别的影响,提出了中文病历环境下机器学习的特征选择和模板设计的一些基本规则。在模板抽取和填充阶段,依据词类的语义标注进行浅层句法分析,并以此来获取常见的句型模式和抽取规则。最后,通过模式匹配的方法来抽取实体的属性和实体间的关系,并用统一的形式进行表达,最终形成结构化的数据。在抽取实验中,准确率、召回率、F值分别达到了93.7%、87.9%、90.7%,效果比较理想。
其他文献
文章结合大学生“互联网+”创新创业教育目标要求,挖掘和充实《计算机应用基础》创新创业教育资源,探讨调整课程内容、教学方法。在传授专业知识过程中加强创新创业教育,促进《
本文就军校教员如何提高教学授课能力问题展开讨论,主要有两个方面:一是如何提高教员的教学水平,提高其创新能力;二是如何提高教员的授课能力。
当前,国与国之间的竞争,已从单一的经济实力的竞争转化为了综合国力的竞争。由于对新风险的认识不够、管理不善,无法形成行之有效的风险管理机制,因此,风险逐渐渗透到了我们的经济
学位
期刊
枢纽中心坝在水利水电工程中占有重要地位。在施工中,要做好防渗工作,以正确的施工理念设计完善的防渗方案。由于坝基施工的复杂性,施工中有多种施工设备。合理的施工技术在坝基
伴随中国经济的快速发展,建筑是现代城市建设的重要组成部分。在建筑防渗漏施工技术的探讨可以从客观的角度分析中国建筑业的发展,并发现在中国的建筑防渗漏、泄漏技术应用中存
肥料是植物生长发育的物质基础。随着国民经济的迅速发展,农作物产量和复种指数的提高,对地力和肥料的消耗就越来越大。解决的办法除合理安排作物轮作换茬、用地与养地结合
一一个月前的香山,第四代导演研讨会,大师兄张华勋在门口碰见我,说会议主持人希望他讲讲当初头一个拍娱乐片的甘苦。我说,是该好好讲讲。后来他讲了,虽然至今不悔,但言谈话语
当前,低温省煤器技术越来越多的在燃煤电厂进行推广应用,在发挥节能作用的同时,因其设备泄露造成的影响也开始备受业内人士关注。如何采用行之有效的手段来对低温省煤器的泄漏进
路面基层在路面结构中起着重要的作用,同时也承担着传递竖向荷载的能力。路面结构技术作为一种重要的承重结构,提高了路面施工技术的强度,为公路建设的发展创造了有利条件。路面