基于深度学习的中医临床病历事件抽取方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:nogoodvip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
临床病历文本中所包含的信息资源极其丰富,却因其规范化程度有限而导致信息无法被有效地提取和利用。病人以往的病情、诊断和治疗记录,对辅助医生做出更好的医学决策具有重要意义。本文的研究任务是对中医临床病历文本进行事件抽取,以事件为单元对病人的病情发展进行呈现,同时抽取出每个事件的发生时间。事件抽取技术是从非结构化信息中抽取出用户感兴趣的事件,并以结构化表达方式呈现给用户。经过研究发现,不管是在研究任务上还是研究范围上,当前主流的事件抽取方法并不适用于本文的研究工作。针对以上问题,本文基于深度学习的序列标注方法,对中医临床病历的事件抽取任务进行了研究,主要完成了两个工作。首先设计了一套基于序列标注的中医临床病历事件抽取标签结构,可同时抽取出事件和事件的时间;然后针对本文特殊的研究任务,设计了一套多元的事件抽取评测体系。本文主要工作如下:(1)数据集的构建。因为研究任务的特殊性,本文并未采用传统事件抽取应用的公开数据集,而是以湖北省五家中医院的新型冠状病毒肺炎的诊断病历文本作为数据集,对此数据集进行了规则匹配算法及人工审核的处理,以提高数据集的规范性。(2)标签体系和评测体系的设计。本文进行了独特的标签体系设计,采用EVENT和TIME双属性标签嵌套标注,取得了良好的应用效果。同时,针对本文的临床病历事件抽取任务,设计了严苛和松弛两套评价标准。其中,松弛的评价标准中又根据松弛程度递增构建了6个不同的评价标准。(3)基于深度学习的事件抽取方法研究及应用示例。本文采用了BiLSTM+CRF的深度学习方法,结合本文设计的标签体系方法,对中医临床病历文本进行了事件和时间的抽取,取得了良好的效果。然后对事件抽取的结果与实体抽取的结果进行了结合应用,基于两者位置进行了匹配,从而获得了实体的时间属性,对纵向的临床研究提供了数据支持。
其他文献
随着扫描测量和计算机技术的不断发展,日常的二维图像测量扫描已经不能满足人们测量的要求,点云数据是三维图像存在的比较常见的形式,相对于二维数据,它能够更加高效存储三维物体详细信息,而激光雷达、Kinect等新型的三维传感器出现,使得点云数据收集会更加的便利,三维点云应用也会越来越广泛。但是目前的点云数据仍具有无序性、稀疏性的特点,并且一些小规模的点云数据集包含的信息及数量有限,所以通过点云数据预处理
计算机硬件计算能力的大大提高和大规模数据集的不断出现,让深度学习技术也在不断迈入新阶段。深度学习系统的发展在带来机遇的同时,也给其测试技术带来了新的挑战。与传统软件相比,深度学习系统在内部结构与外部表现方面均存在很大的差异,无法直接将传统软件测试技术中的白盒测试方法应用于深度学习系统。目前,已有多个关于深度学习系统的白盒测试覆盖准则被提出,但准则在实际系统中应用的有效性尚有待检验。本文主要研究深度
近年来,重大传染病疫情因其持续时间长、扩散范围广、危害程度高、防控难度大等特点,给世界各国经济发展及人民生活带来了严重威胁,成为各国公共卫生安全防治的主要议题。而由于疫情的突发性和不确定性,人们往往无法预测疫情的发生时间与强度,因此在应急物资调度初期及应急高峰期由于物资生产与储备不足或调度不及时等原因,应急医疗物资短缺问题时有发生。同时,随着疫情强度和扩散范围的变化,传染病应急物资调度往往具有动态
避障路径规划问题在因其在移动机器人、无人机(Unmanned Aerial Vehicle,UAV)、通信路由等领域广泛应用,一直是学者们研究的热门方向。针对路径规划问题学者们提出的算法层出不穷,其中快速随机搜索树(Rapid-exploration Random Tree,RRT)算法因其规划效率高、动态环境适应性强、高维可用、概率完备等优点,在路径规划算法中占有重要地位。本文采用基于位姿空间概
本文聚焦居民日用消费品城市配送物流的长期预测,从城市发展的宏观经济环境出发,提出了能够与不同发展进程的城市相契合的居民日用消费品物流需求预测方法,可充分顺应我国地区经济发展不平衡的国情,因地制宜地为我国各城市商贸服务业物流规划提供科学可靠的思路方法和理论支撑。首先,结合物流学科理论和相关标准,严格规范地界定了“居民日用消费品物流需求”的概念,并从多方面分析相关影响因素,构建居民日用消费品物流需求预
迁移学习是指根据已有知识和新知识之间的相关性,运用已有的知识来学习新的知识。按照是否使用深度学习方法,迁移学习可以分为传统迁移学习和深度迁移学习。当迁移源域和目标域的特征空间相同且类别空间相同,但边缘分布和条件分布不同时,该问题称为域适配问题。迁移学习的目的是为了解决在样本不足、标签不全等情况下,机器学习任务如何借助外部数据进行有效学习的问题。因此,迁移学习具有重要的实际应用价值。本人独立完成了如
对遥感图像中的道路进行自动识别与分割在地理信息系统数据的更新、土地管理、城市规划、军事打击等不同应用领域都有着十分重要的应用价值。随着科学技术手段日新月异的发展,机器学习和人工智能技术在人们日常生活中的应用更加广泛,如何利用深度学习算法更加高效地解决遥感图像道路分割的难点,提高遥感图像道路分割的精度,简化神经网络训练过程中的难度已经成为各国学者们的重点研究方向。本课题基于深度学习理论并结合可见光遥
随着我国经济快速发展,人们的生活水平逐步提高,生活节奏逐渐加快,消费观念开始转变,越来越多的人选择搭乘出租车出行,出租车行业规模日渐庞大,车载GPS系统等采集设备也积累了海量的出租车行驶数据。与此同时,出现了出租车定价体系不够合理、评价与监管体系不够完善、出租车资源浪费等问题。目前行业内对出租车的经营状况的画像研究还远远不够,无法做到针对出租车的个性化分析从而采取更有效的管理措施。因此,本文尝试基
在信息爆炸的时代背景下,大量重复冗余的信息充斥人们的生活,如何从众多无结构或半结构的信息里提取出高质量且精准的信息是信息抽取任务快速发展的原因之一。信息抽取在问答系统、数字图书馆等任务中都有广泛应用,实体关系抽取是其重要的子任务之一。传统和基于深度学习的实体关系抽取方法已经在实际应用中取得了较高的准确率,但其主要集中在特定领域,在面对不容易获得大规模监督训练数据集的实体关系抽取任务时,传统方法逐渐
软件缺陷预测是一种以提高软件质量为目的通过预先识别可疑缺陷模块为软件测试资源分配提供决策支持的技术。但是软件缺陷预测模型的性能取决于所考虑的软件特征的质量。冗余和不相关特征可能会降低模型的性能,这就需要特征选择方法来识别和移除这类特征。本文针对软件缺陷预测中的特征选择进行深入研究,主要研究工作如下:(1)本文将软件缺陷预测特征选择问题转化为多目标优化问题。结合特征工程的实际意义,在综合分析模型运行