基于SentencePiece的中医学分词模型建模研究

来源 :世界中医药 | 被引量 : 0次 | 上传用户:hyb332145820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:探索构建适用于中医学领域的分词模型.方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试.结果:中医学分词模型在测试集中的Kappa系数为0.79(一致性程度很高),准确率为0.84,宏观精确率为0.84,宏观召回率为0.83,宏观f1得分为0.83.结论:所构建的分词模型对于中医学专业术语有着较好的切分效果,表明该方法可运用于中医学领域的分词模型的构建,可为进一步地研究中医学分词提供方法学参考.
其他文献
Objective:To explore the improvements in sleep duration,drowsiness and daytime fatigue in pa-tients with sleep-wake disturbance after ischemic stroke treated by
“生活中处处皆数学。”《数学课程标准(实验稿)》“强调从学生已有的生活经验出发,让学生亲身经历将实际问题抽象成数学模型并进行解释与应用的过程,进而使学生获得对数学的理解的同时,在思维能力、情感态度与价值观等多方面得到进步和发展。”本人在本文中将结合自身的教学实践谈谈如何运用转化思想,构造数学模型,解决生活中的数学。  一、运用转化思想,构造方程(组)数学模型  现在,数学命题越来越贴近实际生活,关
鸡西矿业集团公司张辰煤矿西三采区3
期刊