改进的HMM应用于哈萨克语词性标注

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ysx688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
哈萨克语的词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础。在传统的HMM的基础上改进了HMM模型参数的计算、数据平滑以及未登录词的处理方法,使之更好地体现词语的上下文依赖关系。利用基于统计的方法对哈萨克语熟语料进行训练,然后用Viterbi算法实现词性标注。实验结果表明利用改进的HMM进行词性标注的效果比传统的HMM好。
其他文献
提出了一种新的确定径向基函数中心的方法.该方法首先利用交叉迭代模糊聚类算法确定样本数据的模糊聚类中心,然后采用正则化正交最小二乘法从模糊聚类中心中进一步优选径向基
证据理论具有比较强的理论基础,能处理随机性或模糊性所导致的不确定性。但证据理论应用中基本概率分配函数(mass函数)难以确定,针对这一问题,提出了一种基于模糊推理的证据理
提出了一种结合梯度和区域信息的多尺度水平集图像分割算法。该算法结合梯度和区域信息构造能量函数,在梯度约束项中,构建了一个基于小波高频分量的边缘检测函数,在区域约束项中,运用经典C-V模型的区域项,得到混合C-V模型,采用变分法求解,并消除了水平集的重初始化。利用小波变换首先在逼近图像中运用混合C-V模型得到粗分辨图像的一个粗尺度分割,再对当前粗尺度下的最终轮廓线作内插操作,将得到的近似轮廓曲线作为
为了使Linux系统能够更好地应用于实时控制的嵌入式领域,通过对Linux内核结构和目前对Linux进行实时改造的主要技术的研究,指出增强Linux内核的实时性能和可预测性所要解决的
以Cr2O3为指示物,以70%基础饲料和30%的待测饲料原料组织成试验饲料,测定尼罗非鱼对13种饲料对料的蛋白质和必需氨基酸的表观消化率。以有效必需氨基酸含量计算了饲料原料中蛋白质的必需氨基
The control system of HIRFL-CSR is now upgrading based-on EPICS,and the control sub-system of power supply also need to be re-designed.The new sub-system consis
期刊
研究3+9+15×0.20ST钢丝帘线在全钢载重子午线轮胎12.00R20 20PR胎体中的应用.结果表明:与3+9+15×0.22+0.15NT钢丝帘线相比,3+9+15×0.20ST钢丝帘线的直径和线密度小,破
美国《现代轮胎经销商》(www.moderntiredealer.com)2017年1月18日报道:普利司通欧洲公司在法国收购104家门店。
IPSec协议的一种实现模式是采用IPSec网关间隔各个网络段,通过网关的策略配置,满足安全通信需求。然而,策略交叉会导致破坏安全需求的信息回流,拆分策略是避免信息回流的有效