面向PICO框架的临床证据属性抽取和关系抽取方法

来源 :东南大学 | 被引量 : 0次 | 上传用户:tonfy1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着临床医学领域的文献日益增多,循证医学相关人员需要阅读大量医学文献以获取最新研究成果。尽管领域专家总结了临床证据供相关人员参考,但人工总结临床证据是费时费力的,因此自动抽取结构化临床证据成为加快循证医学实践的重要课题。现有关于结构化临床证据的研究通常为句子级别文献摘要或少数重要属性的识别,而面向结构化的临床证据抽取的相关研究极少。但句子级别摘要仍属于非结构化信息,不能够直接构建结构化临床证据,识别到少数重要属性也不足以全面描述临床证据。基于以上背景,本文研究了面向PICO框架的临床证据属性和关系抽取方法,尽可能抽取丰富的结构化信息。主要研究内容如下:(1)提出了面向PICO框架的层次化属性和关系抽取方法(Hierarchical Attribute and Relationship Extraction for PICO,HARE),该方法包含两个步骤:句子划分和短语分类,句子划分采用Meta Map工具,短语分类使用面向PICO框架的层次化多类别分类方法。HARE中提出了用于短语分类的两个新样本特征:基于短语的最短依存路径特征,该特征获取长句中与待分类短语位置不相邻的重要信息;标签对样本的注意力特征,该特征根据样本统计信息得到描述标签的关键词,并强调描述标签的关键信息。HARE最终输出临床证据的候选属性和关系集合。通过特征消融实验和对比实验,本文证明了HARE方法中特征提取和分类方法的有效性。(2)提出了基于规则的临床证据生成方法(Rule-based Clinical Evidence Generation,RCEG),该方法包括去除候选集合的冗余和基于规则生成三元组两个步骤。首先根据文本相似度去除候选集合中的重复信息,然后将描述属性和关系的文本转化为结构化临床证据的三元组。在三元组生成过程中使用基于规则的方法,包括:基于正则匹配生成患者年龄、受试样本排除标准和用药剂量,基于语义规则生成疾病或症状等。通过自定义的临床证据评估策略和人工评价,展示了RCEG方法生成的结构化临床证据的质量。(3)设计并实现了临床证据生成和可视化系统(Aceso Evidence,Aceso E)。该系统与现有研究相比,较为全面地识别了基于PICO框架的结构化临床证据中的属性与关系。Aceso E集成了HARE方法和RCEG方法,主要功能包括上传待分析的文献摘要、生成结构化临床证据、可视化临床证据和结果下载。综上所述,本文研究了面向PICO框架的结构化临床证据的属性和关系抽取方法:首先基于深度学习识别属性和关系的候选集合,然后基于规则生成结构化临床证据,最后设计并实现了临床证据生成和可视化系统。
其他文献
在国内外各行业存在着各式各样的证件,在过去,证件的内容以手写为主,工作量大并且存在字迹不易辨认的隐患。随着打印机技术的发展,这些证件的内容可以通过打印机打印出来,极大的提高了正确性和效率。由于这些证件具有封面较硬,厚度较厚的特点,激光打印机或者喷墨打印机很难完成打印任务,因此证件上的内容是靠证件打印机打印出来的。随着互联网技术和信息化的发展,自助服务终端的使用愈发广泛,证件打印机也被广泛应用于自助
无人机具有成本低、功能多样等优势而在军用、民用领域得到广泛运用,而发射系统是无人机系统正常运转最重要的前提保障。本文主要对无人机发射系统进行研究和优化,致力于提高无人机在发射过程中的稳定性与可靠性。以某火箭助推发射无人机为例,基于理论建模和仿真分析,研究发射阶段的运动学与动力学参数变化情况,以及对各个部件的性能影响;通过数据分析,优化机械结构和工作参数,为发射阶段的顺利完成提供基本保障。本文完成的
近年来,随着我国教育改革的持续深化,小学教育模式正在发生巨大转变,传统应试教育逐渐被以学生为主导的新型教育模式取代。如何回应这一转变,成为小学教学建筑空间设计的重要考量。同时,学校建设也面临着教学规模扩大、用地集约化及现行规范限制等多重挑战。通过对新型教育模式及其空间诉求的调查研究,可以发现,小学教学建筑中对教室以外的非正式学习空间的需求激增,学习模式的转变成为小学教学建筑设计破局的持力点。如何应
城市公共空间一直以来都是我国规划学界关注的焦点,在其周边布局并合理规划居住用地具有重要性与合理性,然而当前城市公共空间周边的居住用地规划仍存在一定问题,利用我国当前“城市双修”背景契机,对此类居住用地规划设计展开研究。首先,梳理国内外城市公共空间发展历程,归纳城市公共空间发展至现阶段所具备的多元价值。其次,结合目前居住用地规划设计发展趋势,以及城市公共空间的多元价值对周边居住用地规划设计的要求,共
在各类型城市遗产中,传统居住型历史地段是与日常生活密切相关的历史地段。因长期处于动态变化中而表现出较强的复杂性和矛盾性:社会各界对保护价值的认知和发展走向不明确、不一致;建筑产权和社会结构复杂;保护等级参差不齐、低保护等级的建筑偏多。因此其呈现出高价值与低保护水平之间的矛盾、现代化生活需求与低居住水平之间的矛盾,保护发展陷入“困局”。为探寻“致困之源”,本文借助社会资本理论与研究框架,在学习国内外
可见光通信因为无需频谱规划、保密性好、无电磁污染等优点,近来得到了学术界的广泛关注。本文围绕可见光通信室内覆盖系统的无线资源分配算法,研究了移动用户的接入LED选择方案、时隙与功率分配方案、NOMA VLC下行链路功率分配方案,具体内容如下:一、针对LED的数目多于用户数目的VLC室内覆盖场景,在一个用户可以选择多个LED作为接入点的条件下,基于SINR门限尽可能大的准则构建了用户接入点选择问题对
随着我国城市化加剧及建筑业的日益发展,材料发生了极大改变。玻璃作为一种绿色环保材料,在建筑领域得到广泛使用,成为建筑外界面的常用材料。而彩釉玻璃由于其半透明特质,色彩丰富、肌理图像多样,材料性能优良,使用范围广泛,能创造出时尚、现代的外观,受到人们的青睐,在建筑外界面的应用上大放异彩,也呈现出更加多样、复合的发展趋势。因此,彩釉玻璃外界面的应用研究对启发建筑师的创作思维、促进彩釉玻璃外界面的节能和
政府和新闻媒体为确认事件真相、还原现实情况,需要获取亲历者对事件的直接描述和反馈,从而报告真实内容、采取相应措施。随着信息技术的发展及社交网络的普及,亲历者发现由线下转向线上,社交网络中亲历者发现的研究可极大地便利相关部门和新闻媒体接触亲历者并获得可靠的第一手信息。已有研究大多仅着眼单一事件类别,基于人工特征工程进行针对性的特征提取,采用统计机器学习技术开展文本分类工作。此类研究需要较多的人为工作
针式打印机是一种不同于激光、喷墨和热敏打印机的产品。它是靠机械作用力撞击色带,进而把色带上的油墨压印到纸上来显示信息。这个显著特点使其可以打印多层的压感纸。针式打印机具有独特的装纸通道,可以适应证件的打印。因此针式打印机在邮政、物流、税务等领域取得了广泛的应用。本论文致力于研究一个全新的基于Cortex-M4 CPU和CPLD(Complex Programmable Logic Device)技
目前火电仍是我国电力供应的主体,电站燃煤过程会产生大量的污染性气体,从而对环境造成危害,而通过运行优化技术来实现锅炉燃烧效率的提升,同时减少NOx等污染气体排放,对进一步挖掘能源行业节能减排的潜力,促进行业的技术进步具有重要意义。由于锅炉燃烧系统包含复杂的反应过程,燃烧过程具有强耦合、大惯性和非线性强的特点,且机组面临煤质和负荷多变的客观条件,而常规的燃烧优化系统大多只能实现稳态和开环优化,不易取