论文部分内容阅读
电子病历系统不断发展和普及使用,产生了大量的临床医疗数据,其中包含有各类病例临床数据和描述,蕴含着大量的临床医疗知识,对医务工作者诊疗工作的进行和我国基础医疗的发展有重要的意义。而医学信息资源的不断丰富和扩充也开始挑战人们高效准确获取所需信息的需求,存在着中文医学信息“无限扩容与有限利用”的矛盾。 信息组织通过对信息外部特征和内容进行整理和排序使得信息有序化与优质化,实现将无序信息转换为有序信息,从而为实现信息的流通和组合奠定基础,促进用户对信息的有效获取和利用。现有的电子病历中文医学信息主要依靠各种病历信息系统和基于关键字的病历检索系统进行组织,这些病历中文医学信息组织方式主要存在以下问题:由于病历信息系统在设计和实现中主要以满足业务流程需求为目的,并且受病历结构化技术的发展所限,非结构化的中文医学文本信息没有得到充分的利用;基于关键字的病历检索系统不能很好的兼顾语义和上下文信息,限制了检索的效果,不利于临床科研工作人员和医生迅速便捷地获取所需的信息。 为提升电子病历中文医学信息组织的效果,本文针对上述问题提出了面向电子病历中文医学信息可视组织与交互解决方案:首先利用现有的脱敏电子病历数据和网络爬虫构建了电子病历中文医学信息数据集并进行了去停、分词等预处理;然后利用开源的Mallet工具包对中文医学信息数据集进行了主题建模;最后为了辅助分析人员快速把握主题模型蕴含的信息构建了可视形态集及对应的交互操作集合,并最终构建了面向电子病历中文医学信息的可视组织与交互系统,实现了基于主题模型的电子病历中文医学信息的可视组织,提高了临床科研工作人员获取信息和探查病历文档的效率。 通过实例验证了基于主题模型的面向电子病历中文医学信息的可视组织与交互系统可以有效的辅助临床科研工作人员对电子病历中文医学信息进行主题建模和分析,并有利于进一步的诊断。