【摘 要】
:
[目的]对基于神经网络的中文医学文本命名实体识别模型进行分解,研究符号表示层和上下文编码层中基础神经网络模块功能以及多神经网络模块协同组合对实体识别性能的影响。[方法]基于CCKS2017、CCKS2019和IMCS-NER等中文医学文本命名实体识别任务发布的基准语料,对比分析神经网络模型的符号表示层和上下文编码层采用不同神经模块时的性能差异。然后以此为基础,分别构建将多神经网络模块集成、并联、串
【基金项目】
:
国家社会科学基金一般项目“基于知识图谱推理的健康信息可信度计算研究”(项目编号:20BTQ092)的研究成果之一;
论文部分内容阅读
[目的]对基于神经网络的中文医学文本命名实体识别模型进行分解,研究符号表示层和上下文编码层中基础神经网络模块功能以及多神经网络模块协同组合对实体识别性能的影响。[方法]基于CCKS2017、CCKS2019和IMCS-NER等中文医学文本命名实体识别任务发布的基准语料,对比分析神经网络模型的符号表示层和上下文编码层采用不同神经模块时的性能差异。然后以此为基础,分别构建将多神经网络模块集成、并联、串联的实体识别模型,比较和分析其性能差异。[结果]符号表示层使用hfl/chinese-macbert-base、hfl/chinese-roberta-wwm-ext、hfl/chinese-bert-wwm-ext等预训练语言模型能显著提高识别性能;在上下文编码层串联神经网络模块能够提高识别性能;基于集成的神经网络具有最低的优化成本,实现了最佳的性能。[局限]本文实验仅基于中文医学文本语料,因而所得结论有待在其他语言的语料上进行验证。[结论]基础神经网络模块的类型和多神经网络模块的协同方式显著影响神经网络在中文医学文本命名实体识别任务上的表现。
其他文献
<正>我国是鸡蛋的生产和消费大国,鸡蛋是我们生活中的常见食品,富含蛋白、维生素和氨基酸,因营养全面被称为“理想的营养库”,营养学家则称它为“完全蛋白质模式”。鸡蛋具有补脑益智、保肝、防动脉硬化、防骨质疏松和提高免疫等功能。因食用多样化,群众基础广泛,但鸡蛋外观是影响购买和消费欲望的重要因素,因此鸡蛋的生产者应重视鸡蛋的外观,并通过鸡蛋外观反应的信号来判断蛋鸡营养、疾病和生产等是否存问题,有利于提高
体育舞蹈是一种技术性、力量性较强的运动项目,为此,应加强体育舞蹈的技术特性和力量训练方法,以达到体育舞蹈训练的目的,提高学生对体育舞蹈的技能和兴趣。基于此,本文对体育舞蹈技术特征和力量训练方法进行了分析和研究。
随着新能源电动汽车的发展,磷酸铁锂(LiFePO4,LFP)电池的报废量逐年剧增,由于其有价金属锂含量低,回收经济性差,近年来废旧LFP的低成本回收成为研究热点。基于同构诱导置换浸出,以FeCl3为浸出剂,在固-液反应体系中探究了FeCl3对LFP中的锂浸出的影响因素,利用未反应核收缩模型探究了两个浸出阶段的宏观动力学。结果表明,增大FeCl3/LFP摩尔比、减小固液比和升高反应温度可以显著促进锂
中外合作办学作为一种全新的办学模式,适应了新时代对我国高等教育国际化发展的要求。开展合作办学是我国教育领域与国际接轨的一项重要举措,是充分利用国外优质教育资源,提升我国国际化教育水平和层次的有效途径。外语教学在中外合作办学的整体框架内,对学习合作专业知识、语言和国外文化方面起着重要作用。本文基于中外合作办学的发展模式,以中外合作办学的韩语教学实践为切入点,指出目前韩语的教学现状,并提出教学实践策略
<正>2020年10月29日,中国共产党第十九届中央委员会第五次全体会议通过了国民经济和社会发展第十四个五年规划,"十四五"时期是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主义现代化国家新征程、向第二个百年奋斗目标进军的第一个五年,我国将进入新发展阶段。进入新发展阶段,国内外发展环境更加纷繁复杂。从外部发展环境来看,世界进入发展变革期。贸易保护主义、单边主义涌动,各
当下我国大数据法律监督实践存在成绩突出与问题徘徊并存的局面,学术界应当提炼标识性概念、建构原创性理论予以回应。以纵向沿革和横向比较的角度观之,相关探索呈现为由国家力量主导的现实样态,所处阶段展现回归、升级进而穿透事实查明层面的内在规律。此类法律监督以大数据及相关科技为支撑力,以多案监督为着力点,以促进国家、社会治理现代化为大目标;关键要素包括检察大数据、批量异常案件发现模型、人机耦合技战法等,重中
研究了采用H2SO4+H2O2浸出体系从废旧磷酸铁锂电池粉中选择性回收锂,考察了硫酸用量、温度、浸出时间和H2O2用量对Li、Fe、P浸出率的影响。结果表明:在90℃下浸出60 min,控制硫酸和H2O2用量分别为理论量的1.2倍和3倍,Li浸出率可达99.87%,Fe、P浸出率均仅为0.45%,锂的选择性浸出效果较好;浸出反应过程符合未反应收缩核模型,反应表观活化能为11.753 9 kJ/mo
<正>在义务教育数学学习过程中,一般字母、数字、数学符号表达数学的代数式、关系式、方程、函数、不等式还有图表、图形都是数学模型。本文结合自身的教学实践和小学生的学习特点,对如何有效提升小学生的数学模型意识,分享以下经验和思考:立足生活实际,直观感知模型数学知识的学习是来源于生活的,把抽象的数学模型通过生动的生活实例展现出来,可以化抽象为直观,让学生感受到数学知识新鲜有趣好玩,直观感知数学模型。以苏
<正>机关单位的主要核心职能是为社会群体提供高质量的公共服务,旨在为我国各个领域的发展提供必要的保障。随着我国市场经济体制改革的不断深入,机关单位面临前所未有的挑战和机遇。人员是机关单位智力输出、劳力支出的主要力量,机关单位公共服务能力提升的关键在于加强对人员的管理。机关单位开展人员管理,对激发人员内在潜力、促进人员职业发展、帮助单位吸纳更多高质量人才等方面具有重要作用。
中文电子病历的命名实体识别是临床医疗领域中文本信息挖掘的重要任务之一,而中文电子病历有着较为独特的文本结构以及词语分布,但通用领域的预训练模型不能很好地将医疗相关实体注入词的表示中,这对电子病历命名实体识别的效果有着负面的影响。为了更好地表示电子病历文本,且能进一步提升预训练模型对电子病历命名实体识别的效果,提出了基于医疗MC-BERT命名实体识别模型,即MC-BERT-BiLSTM-CRF(MB