【摘 要】
:
在文档电子化的文本自动分析、理解和识别过程中,除了有关文档内容的字符识别外,还必须解决字体识别问题.字体识别不仅是版面分析、理解和恢复的重要依据,还有助于实现高性能
论文部分内容阅读
在文档电子化的文本自动分析、理解和识别过程中,除了有关文档内容的字符识别外,还必须解决字体识别问题.字体识别不仅是版面分析、理解和恢复的重要依据,还有助于实现高性能字符识别系统.有别于目前基于多个字符组成的文本块的字体识别方法,本文提出了一种基于单个汉字字符的字体识别方法.在单个汉字字符上提取两类特征:笔划属性特征和笔划分布特征,分别构成两个分类器对单个汉字字符进行字体识别,并集成两个分类器的结果得到最终的识别结果.我们使用的笔划属性特征分类器是文本无关的,而笔划分布特征分类器是文本相关的,集成的分类器属于文本相关的字体识别分类器.我们在包含7种字体的样本集上进行了测试,测试结果显示基于单字的字体识别率达到94.48%.
其他文献
目的应朋抗自身免疫性肝病自身抗体组合四项“线粒体M2型(AMA M2)、肝肾微粒体1型(LKM—1)、肝溶质抗原1型(LC-1)、可溶性肝抗原/肝胰抗原(SLA/LP)”.血清学诊断自身免疫性肝病。方法采
本文以民勤沙区4种典型防风固沙林为研究对象,基于文献综述和专家咨询等方法构建评价指标体系,运用层次分析法获得各评价指标权重,利用改进的生态系统健康指数模型(HI)计算防
文章通过分析我国高校视觉传达设计专业发展的现状,针对存在问题寻找适合我国应用型本科院校发展此专业的方法——以创办特色化的专业为办学思路,使学校与社会的专业对接,并
为加强学生对于建筑空间的认知,学习建筑空间序列的创作手法,将中国古代建筑群体、中国古典园林与当代极少主义建筑作为空间分析经典案例,引入建筑空间序列的教学当中。指出"
近年来,我们在官兵中开展了徒手心肺复苏普及活动,取得了较好效果。现将我们的做法报告如下。1加强组织领导将普及徒手心肺复苏纳入部队卫生防病日程,由团卫生防病工作领导小
<正>8月31日,中央纪委、监察部、国务院国资委在京召开规范中央企业负责人职务消费座谈会。中央纪委副书记、监察部部长、国家预防腐败局局长马出席会议并讲话。她强调,规范
运用混沌蚁群算法进行图像的边缘检测是针对混沌蚁群算法具有随机性、遍历性、正反馈性,通过更新信息素矩阵来计算图像阈值,从而获得图像边缘信息,能够更全面、迅速地找到图
在系统总结了土木工程材料课程具有内容庞杂、概念多、逻辑性较差等特点的基础上,提出了土木工程材料课程课堂教学方法更新策略,以调动学生学习的主动性和积极性,激发学生的
本文通过分析传统汉字的结构模型所具有的优缺点,提出了建立脱机手写汉字统计模型的理论框架;并利用PCA技术发现大量数据规律性的能力,提出了一种基于PCA技术的脱机手写汉字
为了实现工程教育与国际接轨,工程伦理教育逐渐被中国工程教育界所重视,在中国开展工程伦理教育势在必行。因此,结合现实条件和课程特点探索实现工程伦理教育的适宜形式是非