古籍文本挖掘技术综述

来源 :科技情报研究 | 被引量 : 0次 | 上传用户:ysy8023zq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]采用深度学习、自然语言处理等文本挖掘技术、方法和理念,对海量中国古籍进行文本挖掘,不仅有利于促进中华传统文化的传播和推广,而且对提升国家文化软实力具有重要意义。[方法/过程]在厘清古籍文本挖掘概念的基础上,整体把握古籍文本挖掘技术应用现状,从文本特征提取技术、词汇级文本挖掘技术、句子级文本挖掘技术、篇章级文本挖掘技术和知识组织与呈现等5个方面梳理了广泛用于古籍文本挖掘的算法、模型、工具。[结果/结论]较为全面地梳理了古籍文本挖掘领域的常用技术,总结了存在的问题并进行了展望。
其他文献
当前以素养为本的“双新”背景下,高中生物教学理念随之变革,在关注学生学科知识学习的同时,对学生的学科核心素养发展提出了更高的要求。在此背景下,为了构建高效的生物课堂,积极推动高中生物单元设计优化,围绕核心素养培养目标整合内容,有助于为学生知识学习和能力培养提供指导,并且在思想和情感层面介入引导,有助于给学生提供素养高水平发展的空间,切实提升生物教学质量。基于此,文章主要从核心素养角度来分析高中生物
古汉语文本信息处理和语义理解一直是自然语言处理领域的重难点之一,而断句又是语义理解中的基础任务。传统的机器学习方法解决古汉语断句问题需要基于大量的专业标注语料,过程繁琐,效果不佳。本文基于已有的BERT模型,在《四库全书》中文繁体版全文数据集的基础上构建了SikuBERT预训练模型,并将该模型迁移到《方志物产》数据中,完成了在不同数据集上的古汉语自动断句实验,实验最优F值为77.23%,比基础的B
马赛克战作为"决策中心战"理论的一个实现方式,将成为未来战场作战的一个关键发展方向。基于马赛克战的主要特点,文章对马赛克战的无人化作战思想进行了总结,分析了马赛克战下的无人化作战特点。在此基础上,从现有关于态势感知、通信技术、任务分配的研究内容,对无人化作战的关键技术进行分析,从无人平台组合优化、无人指控人机交互以及战场态势感知支持方面对无人化作战指控提出了展望与下一步的研究方向。根据现阶段马赛克
长征精神是人类历史上的伟大精神,是中国共产党领导中国人民寻求革命真理的历史丰碑。传承和弘扬长征精神,既可增强当代青年对革命文化的认同,又是当代青年在新时代长征路上奋斗的不竭动力。
[目的 /意义]古籍引书的计算人文研究视角将带来数字化资源、量化分析内容以及可视化呈现结果。[方法 /过程]以《春秋左传正义》中引书为对象,对其中引书进行标注、组织、计量、可视化及主题挖掘研究。[结果/结论 ]通过古籍引书知识标注和补全,完成引书知识库的构建,以引书、篇章和作者为例进行计量分析,对结果进行可视化形式呈现,并尝试构建其知识图谱。此外,结合LDA主题模型,挖掘引书句子主题内容,得到生产
坚持以人为核心推进新型城镇化需要顺应农村劳动力流动趋势。基于“河南省‘百县千村’人口流动调查”数据,实证考察了河南省农村劳动力在乡镇、县城、省辖市、省会和三大都市圈等多种空间类型的就业分布。从整体看,河南省农村劳动力就业空间分布呈现出两端多、中间少的“U”形特征,省内则以郑州市区和各县县城为主要就业地点。受教育程度、就业信息来源等个体因素,家庭人口规模、家庭抚养比等家庭因素,村庄区位和经济基础等村
同时定位与建图技术(Simultaneous Localization and Mapping, SLAM)是实现自动驾驶的基本能力。多传感器融合,尤其是激光雷达和相机的融合,对于自动驾驶来说是必不可少的,其中如何针对各种场景调整不同传感器的置信度是一个关键问题,因此提出了一种自适应紧耦合的激光雷达相机融合的SLAM算法:AVLS。首先,AVLS建立在基于滑动窗口的因子图上,包含了灵活深度关联和弹
为了消除投影仪的伽马效应,近年来二值条纹投影轮廓术得到快速发展。如何确定合适的离焦量是二值条纹离焦投影三维测量的关键问题。离焦不足,条纹会包含高阶谐波。离焦过度,条纹对比度降低,相位分辨率降低,同时噪声的影响相对变大。离焦不足或离焦过度,都会影响相位测量精度。为了解决这一问题,本文基于数字相关法提出一种最优离焦量的确定方法。该方法利用条纹与其二阶微分的相关性来确定最佳离焦量,以获得准正弦条纹。在欠
现有的自动破损检测忽略了深度信息,仅使用图像2D信息,难以准确检测复杂环境下的管道保温层破损。为解决该问题,针对轨道式机器人巡检场景,提出一种基于线结构光和YOLOv5的管道保温层破损检测方法。将线结构光加入到视频采集装置中,采集图像经预分割激光域后采用自适应阈值方法提取激光中心线,结合线结构光测量深度原理,主动式测距。经图像拼接由视频自动生成RGB-D图像,解决了RGB图像与深度信息配准问题。最
常微分方程有着悠久的历史,在各个领域中均有非常重要的作用.本文利用变量分离法来求解一阶齐次线性方程,并用常数变易法求解一阶非齐次线性方程,得到一阶线性方程的通解公式.此外,利用降阶法求解二阶齐次线性方程,并把常数变易法推广到求解二阶非齐次线性方程中,得到二阶线性方程的通解公式.