基于语料库统计方法在汉字文本识别应用中的若干问题

来源 :全国第四届计算机语言学联合学术会议 | 被引量 : 0次 | 上传用户:rurucaihongru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高汉字文本的识别率,该文讨论基于语料库统计方法在汉字文本识别后处理应用中的若干问题。分析语言模型的选择、统计标记集的选择、语料库的领域和大小、后处理的算法对处理质量的影响,并给出实验结果。
其他文献
该文提供了一个基于共享和分布式内存系统上的并行模拟算法和数据处理方法。采用域分解的预条件Krylov子空间方法和混合预条件来解决由黑油模拟器产生的大型线性系统问题。基
谷类作物自古以来都是人们生存发展的必需品.东周时期,无论是在生产工具还是种植技术上,较西周时期都有了质的飞越.进入战国,随着铁犁牛耕的推广、耕作方式的精细,加之各国水
北朝是《法华经》信仰最流行的时期,以云冈石窟为代表,在全国各地都出现了大量宣扬《法华经》的二佛并坐题材造像内容,该文通过对麦积山石窟现存二佛并坐图像的调查研究,分析
为求解平面有限区域上的边值问题,首先将其扩展到更大的矩形区域上的两个相邻区域上的边值问题。为同时求解这两个边值问题,从而可以用常规谱方法求解。给出了构造匹配函数的基
大学精神是一所大学的灵魂和大学文化的精髓,给予身处大学的莘莘学子人生的精神动力.大学精神的培养需要文化的积淀与灌养,湖北高校地处荆楚文化的发祥地,可以从荆楚文化中获
[目的]探讨依维莫司对前列腺癌PC-3细胞凋亡及caspase-3表达的影响。[方法]体外培养前列腺癌细胞PC-3,使用不同浓度依维莫司(0mol/L、10-9mol/L和10-8mol/L)干预细胞,四氮唑
计算智能是一种新兴的研究领域,它适于解决难以建立模型的问题。该文分析了基三种组成部分,即神经计算、模糊计算、演化计算的形成背景、基本原理与方法特征,提出了一种通用的演
赣南文化璀璨迷人,赣州驻市高校大学生来到赣州后深受赣南文化的影响,对其产生浓厚的兴趣,从而对赣州文化的传播和推广起到了促进作用.该文通过校级公选课、毕业论文,以及创