【摘 要】
:
头痛是一种常见的神经系统疾病,如何充分利用已有的中文头痛病例文本数据(也就是医生的经验)辅助头痛诊断是智慧医疗领域的重要课题。本文基于集成学习、深度学习等机器学习技术,研究面向中文头痛病例文本的头痛特征抽取方法和头痛诊断方法,以能够为头痛领域的计算机辅助诊断提供一种新的途径。本文的主要工作包括:1.为了能够支撑头痛特征抽取,设计了一个头痛属性规范化表示框架;并按头痛属性规范化表示框架对中文头痛病例
论文部分内容阅读
头痛是一种常见的神经系统疾病,如何充分利用已有的中文头痛病例文本数据(也就是医生的经验)辅助头痛诊断是智慧医疗领域的重要课题。本文基于集成学习、深度学习等机器学习技术,研究面向中文头痛病例文本的头痛特征抽取方法和头痛诊断方法,以能够为头痛领域的计算机辅助诊断提供一种新的途径。本文的主要工作包括:1.为了能够支撑头痛特征抽取,设计了一个头痛属性规范化表示框架;并按头痛属性规范化表示框架对中文头痛病例文本数据进行属性标注,构建了一个用于头痛特征抽取的标注语料数据集。2.设计了面向中文头痛病例文本的头痛特征抽取模型。采用了开源的中文向量词表对中文字符序列进行向量化表示;抽取模型包括基于Bi-LSTM+CRF的头痛特征抽取模型、基于BERT+Bi-LSTM+CRF的头痛特征抽取模型以及基于IDCNN+CRF的头痛特征抽取模型,通过实验验证了抽取模型的有效性;实验结果表明基于IDCNN+CRF的头痛特征抽取模型的抽取效果最佳,可以为头痛诊断提供更可靠的头痛特征。3.设计了基于集成学习的头痛诊断模型,包括基于Bagging(以KNN为基学习器)的头痛诊断模型、基于随机森林的头痛诊断模型、基于Adaboost的头痛诊断模型、基于Gradient Boosting的头痛诊断模型,通过实验验证了诊断模型的有效性;实验结果表明基于Gradient Boosting的头痛诊断模型的头痛诊断效果最佳。4.以基于IDCNN+CRF的头痛特征抽取模型和基于Gradient Boosting的头痛诊断模型为核心,设计并实现了一个基于集成学习的头痛诊断原型系统。本文的主要成果是提出了一个面向中文头痛病例文本、基于集成学习的头痛诊断方法。该方法对头痛领域的计算机辅助诊断具有参考价值。
其他文献
作为一种典型的非均质多相复合材料,混凝土在细观尺度下可以看作由粗骨料、水泥砂浆和两者之间的界面过渡区组成。采用三维实体模型对混凝土的失效破坏机理进行研究具有重要的理论和实践意义。本文采用椭球和凸多面体两种形状,建立了界面过渡区非一致性混凝土三维多相细观模型,研究了混凝土单轴拉伸试件在外荷载作用下的失效破坏路径和机理,在此基础上探讨了细观结构特征对混凝土宏观力学性能的影响,使用三维模型模拟了混凝土三
混凝土帆布是织物增强水泥基复合材料(TRC)的一种,它的性能同时受水泥基体、三维间隔织物以及成型方式的影响。鉴于混凝土帆布在军用帐篷、挡土墙、护坡、水渠、管道保护等领域的广泛应用性,对不同环境中混凝土帆布的应用性能的探究至关重要。本文主要从胶凝材料配方优化、织物几何格局对混凝土帆布力学性能影响及混凝土帆布耐久性三个方面展开了研究工作。在胶凝材料配方优化部分,基于凝结时间45MP
超声相控阵无损检测技术中的全矩阵-全聚焦算法因其成像精度高、聚焦范围广的特点被称为超声无损检测技术中的“黄金算法”,但由于其成像过程中所需的全矩阵数据规模较大且成像算法复杂,因此在实际扫查过程中成像帧率低、实时性不佳,导致其在工业现场的应用受限。为实现单层和双层介质下超声全聚焦成像系统的实时扫查,本文在调研了目前国内外常用的单层介质全聚焦成像方案的基础上,针对双层介质下声程难以实时并行计算且索引矩
随着物联网和人工智能应用的迅速发展,高能效集成电路设计方法成为重要的使能技术。近阈值宽电压设计方法是国际公认的技术途径之一,其中SRAM存储器是芯片低电压工作的瓶颈,面临着读写静态噪声容限降低的问题;低电压下SRAM性能衰退严重,在阈值电压附近工作频率降低到几十兆赫兹,严重影响了近阈值低电压SRAM的应用。时序推测型SRAM是近年来提出的有效设计方法,可提升低电压性能到原本的两倍,但国际上还缺乏通