论文部分内容阅读
标准的档案数字化加工流程大致为档案调卷、整理、著录、拆卷、扫描、影像处理、数据质检、还卷、数据备份、挂接等环节,著录是其中耗时较长且最重要的环节,相比其他环节对工作人员素质有更高要求。当前结合人工智能技术,提升著录的效率有两个途径,一个是图片OCR识别,另一个是智能语音录入。但是需要解决的问题是OCR识别的准确性和语音输人的识别准确率,以及核心的问题需要能够在档案馆离线保密的环境下达成较好的效果。针对目前音、视频档案产生的主要两个途径:口述历史和广电公司的新闻视频文件,通过技术手段提升档案采集过程和采集后整理利用的效率。