不同维度下维吾尔语N-gram语言模型性能分析

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:llccxx1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模的维吾尔语语料条件下使困惑度最低的N-gram语言模型。通过对比分析最终得出结论,对于基于维吾尔语句子的N-gram模型,维度N取在介于3~5之间较宜,困惑度和计算复杂度等因素考虑N=3为较优。这一结论将有助于维吾尔语自然语言处理的发展。
其他文献
期刊
为了提高高电平MMC均压控制的排序速率,提出一种适用于高电平MMC子模块的电容电压分块均压控制策略。首先根据子模块电容电压最值划分分块区域,由排序的复杂度和均压控制效果
为保障核桃产业发展的优质种苗供应,促进核桃产业有序健康发展,云南省玉溪、曲靖两市林业局近日将潋江县林业局马蜂山核桃育苗基地、易门优质苗木繁育基地、江川县海门苗圃等12
卫星通信调制样式识别与参数估计是空间信息对抗的重要内容之一,在获取制太空权、制信息权方面发挥着至关重要的作用。针对卫星通信中常用通信信号的调制识别,在现有谱分析方
一、腭式破碎机进料流程的改革我厂破碎工段粗碎腭式破碎机(400×600mm)原设计进料流程为:磷矿由行车抓入料仓,其中细矿筛下后由板式给料机,皮带机送往反击式破碎机和风
期刊
为了保证系统公平性不受损害,文中提出中心站点采用门限服务,普通站点采用并行调度完全服务的两级优先级轮询控制系统模型。通过马尔科夫链与概率母函数相结合的方法对模型的