基于动态学习方法的中文古籍识别

来源 :第7届中国机器学习学术会议 | 被引量 : 0次 | 上传用户：zj770929

【摘要】

：

古籍识别的难点之一就是样本的收集与训练问题。由于古籍的特殊性，很难收集大量的样本，一交地学习和训练。该文提出一种动态的样本学习与训练方法，在古籍识别的过程中，边整理，边训

【作者】

：

马少平姜哲黄宇

【机构】

：

清华大学计算机系(北京),清华大学智能技术与系统国家重点实验室(北京)

【出处】

：

第7届中国机器学习学术会议

【发表日期】

：

2000年期

【关键词】

：

学习方法古籍识别学习和训练样本学习识别率训练问题训练方法四库全书收集识别字典整理应用滚动测试

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

古籍识别的难点之一就是样本的收集与训练问题。由于古籍的特殊性，很难收集大量的样本，一交地学习和训练。该文提出一种动态的样本学习与训练方法，在古籍识别的过程中，边整理，边训练，边识别，以动态滚动的方式，逐步地完善识别字典。该方法在《四库全书》的识别中得到了应用，经初步测试，首选识别率为94.7℅，十选累计识别率为98.8℅。

其他文献

汉字识别中以词为分类单位的分类器研究

汉字识别中，以往的分类器设计都是以字为单位的“字分类器”。字分类器的输出总是与待识字结构相似的一个候选字集合，这是使后级识别容易产生误识的主要原因。为克服字分类器的

会议

汉字识别分类单位分类器设计词分类器设计的策略实验验证结构相似分类速度输出识字集合方法

基于PCI总线下的汉字识别加速硬件卡的实现

该文提出了基于多处理机下的协处理器工作方式的一种将广泛应用于模式识别领域内的向量比较、排序算法硬件固化的实现方法。采用ＦＰＧＡ技术完成对比较、排序等成熟算法的固化，并实现

会议

总线汉字识别协处理器模式识别领域ＦＰＧＡ技术算法硬件实现方法排序工作方式多处理机成对比较主机应用向量接口ＰＣ

论高校校园地域文化的主要特征

高校地域文化是校园文化建设的重要内容。文章认为高校校园地域文化以客观地域性为首要特征，以历史继承性为基本特征，以开放包容性为显著特征，以开拓创新性为本质特征。上述四点

期刊

campusregional culturechief character

一种联机手写汉字笔划识别方法

在联机手写汉字识别中，笔划识别是一个重要的环节。该文以离散曲线点的支持域为基础，采用Ｋ＝１的平滑近似函数来检测提取折点；利用弹性匹配法对输入的笔划和模板中的笔划序列进行匹配

会议

联机手写汉字识别汉字笔划弹性匹配法离散曲线近似函数笔划识别支持域识别率提取算法输入模板检测计算基础

如何指导学生英语课外阅读

新课标对学生英语阅读能力要求很高,学生想在英语考试中取得好成绩,加强课外阅读势在必行。学校的英语课本实质上是精读(Intensive reading)。目前高考中的英语阅读已远远超

期刊

高中教材阅读技巧阅读理解试题阅读效率考试时间分析判断能力阅读教学意群新闻报道阅读内容

钢铁侠MK1

一直以来HT公司很少推出复刻版本的产品，或许是为了让更多的玩家分享到经典的收藏品，或许是为了不让商家们炒作自己的产品，赚取玩家更多的利益，现在HT决定将这些经典产品重新翻制

期刊

钢铁产品收藏品

基于PCI总线下的汉字识别加速硬件卡的实现毡

该文提出了基于多处理机下的协处理器工作方式的将广泛庆用于模式识别的领域的向量比较、排序算法硬大化的实现方法，采用ＦＰＧＡ技术完成对比较，排序等成熟算法的固化，并实现协处理器

会议

总线汉字识别硬件协处理器ＦＰＧＡ技术排序算法实现方法模式识别工作方式多处理机成对比较主机向量接口ＰＣ

基于知识及分类树的联机汉字识别方法及系统

会议

知识分类树联机汉字识别方法及

基于创新型人才培养的高校校园文化建设研究

期刊

campus cultureinnovationinnovative talents

关于字符规格化的若干基于２Ｄ－Ｍｅｓｈ结构的并行算法

会议

字符规格化结构

基于动态学习方法的中文古籍识别

与本文相关的学术论文