基于不确定有限自动机的蒙古文校对算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:dolan525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先分析了蒙古文电子文本中存在的错误类型、出错原因以及常用的查错纠错方法,然后根据蒙古文特有的书写习惯和编码特点提出一种基于不确定有限自动机的校对算法。该算法采用有限自动机的方法对校对算法所依据的知识词典进行描述,大大提高了文本查错和纠错速度。
其他文献
双语词典是跨语言检索以厦机器翻译等自然语言处理应用的基础资源。本文提出了一种从非平行语料中抽取特定领域双语词典的算法。首先给出了算法的基本假设并回顾了相关的研究
对于是否是中文机构名或机构名简称的自动判别,已经有广泛和深入的研究;但是对机构名简称和全称的匹配,目前鲜有研究成果。本文针对基于中文机构名简称的检索方法,研究了机构名的
决策式依存句法分析,也就是基于分析动作的句法分析方法,常常被认为是一种高效的分析算法,但是它的性能稍低于一些更复杂的句法分析模型.本文将决策式句法分析同产生式、判别式句法分析这些复杂模型做了比较。试验数据采用宾州中文树库。结果显示,对于中文依存句法分析,决策式句法分析在性能上好于产生式和判别式句法分析.更进一步,我们观察到决策式句法分析是一种贪婪的算法,它在每个分析步骤只挑选最有可能的分析动作而丢
6月上旬,中国石油天然气集团公司总经理马富才、总会计师贡华章率集团公司调研组,对四川油气田进行工作调研。马富才总经理一行首先听取了四川石油管理局、西南油气田分公司
信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略:(1)利用句型模板构造抽取规则,然后
<正>铝电解电容器作为主要的滤波元件广泛用于各类电子整机,从消费类电子整机(如:TV、VCD、音响设备、照明电器等)到投资类整机(如:PC机、UPS电源、邮电通讯设备等)均用到电
据国内媒体报道,美国《石油情报周刊》近日公布了2000年世界最大50家石油公司名单,中国石油天然气股份有限公司的综合排名由1999年的第11位跃升至第9位。在公开上市的石油公
<正>小家电,顾名思义就是小型的家用电器,区别于空调器、电冰箱、彩电、热水器、洗衣机、抽油烟机等大型家电,最大的特点是一个人可以不费力地将其移来移去。 从工作原理上分
<正>显示器是计算机系统最关键的部件之一。目前,美国的显示技术仍以阴极射线管为主,因为它可为广大用户提供丰富多采和高清晰度的图文显示,并可满足用户的各种要求。新的显
<正>如果在五六年前,要制作一批高品质印刷品,惟一的选择就是胶印机。时至今日,办公用的大多数印刷品不必再被送到印刷厂,却直接交由打印机来完成了。激光打印等打印技术后来