论文部分内容阅读
古籍识别的难点之一就是样本的收集与训练问题。由于古籍的特殊性,很难收集大量的样本,一交地学习和训练。该文提出一种动态的样本学习与训练方法,在古籍识别的过程中,边整理,边训练,边识别,以动态滚动的方式,逐步地完善识别字典。该方法在《四库全书》的识别中得到了应用,经初步测试,首选识别率为94.7℅,十选累计识别率为98.8℅。