汉语音字转换中同音字(词)的概率后处理

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yichunjekiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文论述了一种新的汉语音字转换的概率后处理算法,该算法用字(词)相对于前后向拼音的条件概率代替常见的字(词)相对于前后向汉字的条件概率,极大地压缩了数据空间,提高了查找效率,使概率后处理的实时应用更趋于现实。该方法也可应用于汉字印刷体和手写体的图形识别的后处理过程。
其他文献
迄今为止,国内电子元器件的出厂质量水平都是用可接收质量水平(AQL)来表示的.供、需双方都以此为根据,并参照国标GB2828—81规定的抽样方案,决定一批产品的接收或拒收.但是在
本文在认真研究了英文字处理系统中回显算法的设计思想后,针对中文信息处理的特点提出了一种新的汉字文本回显算法,该算法以当前屏幕显示文本和修改后新的需显示的文本为已知
专用名词虽然只占中文文章中的词的百分之一到百分之二,但是,如果不对这些专用名词加以处理,将会形成自动分词的错误的大部分。本文首先描述了包括中文姓名辨识的分词方法,然
汉语中词的兼类是一个普遍存在的现象。任何工程化的汉语句法分析系统都不能回避这个重要而难以解决的歧义问题。本文根据汉英机器翻译系统CEMT—Ⅲ的有2万词条的机器词典进
本文是作者最近提出的“潜在歧义论”的第二部分,说明了在中文科技术语的 PT-结构实例化的过程中,可以产生四种不同的树形结构:无歧义结构、歧义消除结构、歧义结构和非法结
1.多元接续技术蜂房通信是由基地台转发信号到各个移动台,需要区分那些不同的地址,这就是多元接续技术.多元接续技术对数字移动通信的频谱利用率、小区结构和系统容量有很大
国际标准化组织(ISO)是当今世界上最大的非政府性国际标准化机构,它除了拥有众多的各类工作机构以外,还设有八个咨询机构,为ISO的工作方针的制定出谋划策,并担负一些重要的工
我厂是机电部定点生产半导体器件的重点骨干企业,现有职工1100名,主导产品有3DD、3DL、3DK、3DG系列大、中、小功率晶体管和BSIT感应器件,同时还生产功率模块、卫星地面接收
据称Tehor公司的新型苯乙烯类热塑性弹性体(TPE)是理想的汽车内饰件。由TeknorApex公司新开发的系列苯乙烯嵌段共聚物热塑性弹性体用于模具制造商生产汽车内部零件,对于广泛使用
R408A、R508A、R1008A气体放电管是一种金属陶瓷结构密封式气体放电管,主要用来保护通信系统、交通信号系统、计算机数据系统以及各种外部电缆与电子仪器的安全