论文部分内容阅读
目前,肝脏类疾病已经成为世界上致死率最高的疾病之一,因为早期病理指标不太明显,有一定的诊断难度。同时由于传统病历数据通常没有统一的结构和标准,尤其是文本病历数据存在大量冗余、歧义、缺失,这增加了医务工作者的诊断难度,甚至直接导致误诊。且不同的医疗机构之间还存在很多信息壁垒,数据没有很好地形成互通和共享,这造成了历史医学数据和肝病诊断经验的流失。而移动通信技术的发展和医疗信息化的不断推广促使电子病历数据飞速增长,其中的文本数据中蕴含了大量的医学语义信息。合理利用电子病历数据能够降低肝病的误诊率。自然语言处理中的文本处理技术可以把文本数据表示成为数字化的特征,然后通过计算机对文本特征的学习和训练,抽象出其中蕴含的语义信息,以此辅助医生的诊疗。本文结合肝脏电子病历数据中文本部分的数据特点,将词向量技术和深度学习理论应用到电子病历文本数据的处理中。针对以往词向量训练方式中忽略文档全局信息的局限性,文中加入了全文词语共现性统计,使得词语的向量表示能保留更多的语义信息。针对传统的基于特征提取和分类器的疾病预测中存在的缺陷,本文借用部分处理图像数据的思想,提出了医学文本数据的定长矩阵表示,并结合根据LeNet模型提出的PeNet网络模型和改进后的Yoon网络模型,采用集成学习的方法得到了综合模型,并以此在电子肝脏病历的处理中取得了很好的效果。本文在此研究基础上设计和实现了基于病历文本语义分析的智能肝病辅助诊疗系统,提供了基于词向量和深度学习技术的疾病预测、关键信息提取、智能语音转换、相似数据匹配、用户和病历数据管理等功能,一定程度上实现了辅助诊断和数据共享。整个系统分成网页端、移动端、后台服务端三个部分,各个部分解耦分离,通过互联网进行数据交互。经过测试,系统有良好的并发性能和抗弱网能力。