面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例

来源 :图书馆论坛 | 被引量 : 8次 | 上传用户:hero616
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在深度学习技术和预训练语言模型不断发展背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SikuBERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明:SikuBERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。
其他文献
中华优秀传统文化所蕴含的“天人合一”宇宙观、“协和万邦”天下观、“和而不同”社会观、“人心和善”道德观,是高校思想政治教育工作宝贵的文化资源。推动中华优秀传统文化融入高校思想政治工作,对于帮助大学生塑造尊重自然的生态人格,增强大学生人类命运共同体意识,提升大学生处理人际关系的能力,确立大学生修身立德的价值取向,具有独特价值和优势。只有以课堂教学为主阵地,以实践教学为演练场,以学校文化为载体,改进传
期刊
期刊
数学是一门抽象性、逻辑性较强的学科。虽然小学数学教材的编排贴近学生生活,但是学生在识记和运用知识点的过程中难免会出现难以理解、学习碎片化等问题。基于此,文章以新课标要求下小学数学教学改革实践为基础,尝试探讨高效开展小数乘法教学的策略。
期刊
作为农业大国,农业农村是我国实现碳达峰、碳中和目标的重要碳减排领域,农业碳排放影响着生态文明建设和经济可持续、高质量发展。基于西北5省份2011—2019年农业碳排放测算数据,分析西北地区农业碳排放现状及特征,并运用SBM-Undesirable模型、LMDI模型评估农业碳排放效率和影响因素。结果表明:2011—2019年西北5省份农业碳排放总量呈现先上升后下降趋势;化肥、地膜、牛、羊造成的碳排放
期刊
期刊
期刊
<正>按照自治区人大常委会2023年监督工作计划,4月11日至14日,自治区人大常委会调研组对我区行政复议工作情况进行了调研。调研组由自治区人大常委会分管领导、部分常委会组成人员、自治区人大监察和司法委员会委员以及自治区人大代表等组成。为保证调研工作有效开展,调研前邀请自治区司法厅、公安厅、自治区高级人民法院相关部门负责同志对调研组成员进行了专题培训。调研中实地察看了中卫市、固原市部分行政复议机构
期刊
期刊
不断推进马克思主义中国化时代化是马克思主义的本质要求,是中国共产党追求真理、揭示真理、笃行真理的集中体现,具有深刻的理论逻辑、历史逻辑和实践逻辑,充分揭示了中国共产党不断走向胜利的成功密码,展现了马克思主义的鲜明特质和旺盛的生命活力。
期刊
报纸