基于短语统计机器翻译模型蒙古文形态切分

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:jsq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文结合最小上下文构成代价模型,借鉴并利用统计机器翻译的方法,尝试解决蒙古文形态切分问题。基于短语的统计机器翻译形态蒙文切分模型和最小上下文构成代价模型分别对词表词和未登录词进行形态切分。前者选取了短语机器翻译系统中三个常用的模型,包括短语翻译模型、词汇化翻译模型和语言模型,最小上下文构成代价模型考虑了一元词素上下文环境和词缀N-gram上下文环境。实验结果显示:基于短语统计机器翻译形态切分模型对词表词切分,最小上下文构成代价模型对未登录词处理后,总体的切分准确率达到96.94%。此外,词素融入机器翻译系统中后,译文质量有了显著的提高,更进一步的证实了本方法的有效性和实用性。
其他文献
自20世纪60年代开展断指再植以来,得到很大发展.我们从1998年12月至2001年12月共进行80例122指各种类型断指再植,现报告如下.1临床资料1.1一般资料:80例中,男性42例,女性38例
提出了高原湖泊污染底泥特征值的数学模型,利用多边形内插法计算污染物总量及各类污染元素,以等值线法全面表达污染底泥的三维分布特征,计算结果与疏浚实践基本吻合,有较好的工程实践和指导意义.
利用BCK催化剂进行了丁烯-1与乙烯的共聚,通过GPC,13CNMR,FTIR,DSC,WAXD等手段研究了共聚单体对丁烯-1/乙烯共聚活性及共聚物性能的影响。表征结果显示,乙烯单体的加入可提高丁烯-1
采用水热法直接制备了Co/Ni促进的纳米MoS2催化剂,利用XRD,SEM,EDX—mapping和HRTEM方法对催化剂进行表征,并以二苯并噻吩(DBT)为模型化合物考察了加氢脱硫(HDS)性能。表征结果显示,该
<正> 酱油是中国的传统调味品。1993年上海市酱油总销售量约9—10万吨,按1990年不变价计算,约合人民币1.3亿元。上海地区的酱油生产厂家分为三大块,即:市区、郊县及三资企业
采用共浸渍法制备了Mg,Ca,Al,Ga改性的Ni—Cu/β分子筛催化剂,采用XRD和NH3-TPD对催化剂进行表征,并用于由合成气制备液化石油气(LPG)的反应,研究了金属元素改性对合成气合成LPG反应的
安全稳定是高校教育管理工作的重中之重,也是高校提升思想政治教育工作成效的基本前提。在网络媒体高度发达的今天,就高校安全稳定工作来说,如果说个体安全事件的发生更多具有偶然性原因,而群体性事件则大多与网络信息传播关系密切。因此,在高校教育管理工作中,要对网络舆情做充分的监控和掌握,并挖掘其应有的舆论氛围影响力,从而使其更多的发挥正能量作用,强化高校群体安全事件管理成效。  当前,随着网络使用的普及,网
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言
由华东理工大学牵头申报的国家重点研发计划重点基础材料技术提升与产业化重点专项项目聚合物材料的轻量化技术获得科技部高技术研究发展中心批准立项,项目总经费8600万元,其中
一、当前市场形势: 近年来本市酱油市场放开以后,出现了一股来自市郊、外省市的低劣质酱油趁虚而入,涌向本市泛滥市场的趋势,经市场调查和实物抽样检测结果可归纳为三个要点: