不同维度下维吾尔语N-gram语言模型性能分析

来源 :现代电子技术 | 被引量 : 0次 | 上传用户：meiwanmeiliao2

【摘要】

：

针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模

【作者】

：

毛丽旦·尼加提古丽尼尕尔·买合木提艾斯卡尔·艾木都拉

【机构】

：

新疆大学软件学院; 新疆大学信息科学与工程学院;

【出处】

：

现代电子技术

【发表日期】

：

2004年期

【关键词】

：

N-gram语言模型性能分析 SRILM MITLM 困惑度平滑算法机器翻译

【基金项目】

：

国家自然科学基金项目:面向汉维机器翻译性能优化的关键技术研究(61562081)~~

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模的维吾尔语语料条件下使困惑度最低的N-gram语言模型。通过对比分析最终得出结论,对于基于维吾尔语句子的N-gram模型,维度N取在介于3～5之间较宜,困惑度和计算复杂度等因素考虑N=3为较优。这一结论将有助于维吾尔语自然语言处理的发展。

其他文献

中考中的一元二次方程

<正>一元二次方程是初中数学中一个重要内容,是以后学习数学的基础,也是中考必考的知识点.考点一解一元二次方程例1(2014·浙江舟山)方程x2-3x=0的根为_________.【考点】用

期刊

一元二次方程黄果树风景区实数根

以改革促发展　以调整促转变──阳泉市产业结构调整的实践及效果

期刊

产业结构调整结构转型体制转轨阳泉市硫化工促发展

用全等三角形研究“筝形”

<正>一、活动目的1.让学生运用已有的平面图形的学习经验,特别是利用三角形全等研究"筝形"的性质;2.在研究"筝形"性质时,引导学生充分利用已有的研究图形的经验,比如画图、测

期刊

全等三角形对应点ECF

NaCl盐度和NaHCO3碱度对鲤、鲫和大鳞鲃的精子活力及其受精率的影响

研究了不同NaCl盐度(0、1、2、3、4、5、6、7、8、9、10、11、12)和NaHCO3碱度(0 mmol/L、10.00 mmol/L、15.85 mmol/L、25.12 mmol/L、39.81 mmol/L、63.10 mmol/L)对松浦镜

期刊

盐度碱度松浦镜鲤方正鲫大鳞鲃精子活力受精率

高层建筑施工技术要点分析

经济的发展促进了我国城市化进程的不断加快,为解决城市化过快所带来的住房及空间压力,各地多采用高层建筑来作为解决问题的方案。高层建筑是现代建筑业发展的技术结晶,随着

期刊

高层建筑施工技术注意要点

化解影响中国经济发展的四大结构性风险

“唱衰中国”现在很热。“唱”者中既有出于炒作中国威胁的别有用心者,亦有想在“中国热”面前反一下潮流达到自我作秀的人;当然,也有真心为中国发展中的隐忧焦虑的有识之士

期刊

中国经济发展结构性风险浮动汇率

专利权人应怎样进行许可证贸易谈判

<正> 在专利的许可方、被许可方谈判、实施专利的过程中,首先遇到的问题是双方之间的技术谈判。一项专利技术能不能被实施,关键在于技术谈判过程中双方就许可合同中的条款能

期刊

专利代理人技术使用费专利权人专利使用费独占许可化工工艺测试仪器支付方式

基于物联网技术的老人监护智能系统的研究与设计

文章设计是基于物联网技术为孤寡老人专门设计的监护系统,该系统采用功能强大、高灵活性的多协议So C的NRF51822作为处理单元,结合外围设备(包括陀螺仪、加速度计、温度、心

期刊

NRF51822BLE心率

刘鸿伏《父亲》和朱自清《背影》比较

<正>朱自清的父亲比刘鸿伏的父亲社会地位要高得多,但他在自己儿子心目中的地位,却并不比刘鸿伏的父亲更高。在朱自清心目中,父亲并不是一个崇高的形象,恰恰相反,他是一个令

期刊

朱自清《父亲》

论版权转让

<正> 在贸易活动中及一切非继承活动中转让版权,一与其他类型知识产权的转让一样,都要在转让方与受让方之间达成协议,即形成某种合同。大多数国家要求版权转让合同必须是书面

期刊

版权转让经济权利版权法精神权利

不同维度下维吾尔语N-gram语言模型性能分析

与本文相关的学术论文