基于HMM的哈萨克语词性标注研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户：guiminzhu18

【摘要】

：

词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础,对于哈萨克语同样如此。在基于词典静态标注的基础上分析了隐马尔科

【作者】

：

侯呈风古丽拉·阿东别克陈景超

【机构】

：

新疆大学信息科学与工程学院

【出处】

：

计算机应用与软件

【发表日期】

：

2012年2期

【关键词】

：

隐马尔科夫模型哈萨克语词性标注自然语言处理 Hidden Markov model Kazak Part-of-speech tagging Natura

【基金项目】

：

国家自然科学基金（60763005）, 国家教育部、国家语委民族语言文字规范标准建设及信息化科研项目（MZ115-92）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础,对于哈萨克语同样如此。在基于词典静态标注的基础上分析了隐马尔科夫模型HMM（H idden M arkovModel）模型参数的选取、数据平滑以及未登录词的处理方法,利用基于统计的方法对哈萨克语熟语料进行训练,然后用V iterb i算法实现词性标注。实验结果表明利用HMM进行词性标注的准确率有所提高。

其他文献

迎接新世纪实现新跨越——《正气》杂志审读座谈研讨会召开

为了全面提高刊物整体质量，在新的世纪迎接新的挑战，更好地为山西党风廉政建设和反腐败斗争服务，在第一个中国记者节到来之际，正气杂志社邀请省版协主席梁肇唐以及姚文锦、潘俊桐

期刊

反腐倡廉新跨越新世纪研讨会出版工作者一级期刊弘扬正气办刊宗旨党风廉政建设编校质量

多语种（汉、维、哈、柯文）辅助办案系统的开发

结合新疆少数民族地区公安机关的工作实际,在充分考虑到基层执法办案民警的需求后,开发出了中文、维吾尔文、哈萨克文、柯尔克孜文辅助办案系统。重点介绍辅助办案系统的系统

期刊

多语种公安辅助办案系统Multilanguage Public security Computer-aided case handling system

持续气道正压通气对胸腹部手术患者术后并发症和死亡率影响的Meta分析

目的:系统评价持续气道正压通气对胸腹部手术患者术后并发症及死亡率的影响。方法:计算机检索PubMed、The Cochrane Library、CKNI、VIP和万方数据库,查找有关持续性正压通气

期刊

持续气道正压通气胸腹部手术并发症死亡率META分析

宫颈癌早期筛查及检测新策略

在过去的几十年里,美国在基于人群的广泛筛查发现,宫颈癌发病率和死亡率的显著下降。尽管取得了这样的筛查结果,但据估计2018年有13,240名美国女性被诊断出宫颈癌,并有4170人

期刊

广泛筛查细胞学检测hrHPV检测宫颈癌

慢性牙周炎伴冠心病患者龈沟液及血清中瘦素水平的研究

目的:研究慢性牙周炎伴冠心病患者龈沟液及血清中瘦素的表达水平。方法:检测对照组、试验组(慢性牙周炎组、冠心病组、冠心病伴慢性牙周炎组)血清及龈沟液标本瘦素水平,并对

期刊

慢性牙周炎冠心病瘦素

长大的滋味

长大会是什么滋味呢？小时候的我经常会想，最开始我以为长大的滋味无非就是酸甜苦辣万般皆有，长大的滋味无非就是可以做自己所爱的洒脱。但随着时间的推移我会觉得长大后的滋味无

期刊

长大滋味

抗侧信道攻击的椭圆曲线密码算法

椭圆曲线密码系统具有较高的安全性和有效的计算性,非常适合于资源受限的嵌入式移动环境。侧信道攻击是一种强有力的密码攻击方法,利用密码芯片在运算过程中泄露的信息对芯片的密码算法进行攻击。针对侧信道攻击椭圆曲线密码系统主要集中在对标量乘运算的攻击,提出一种基于RWNAF(Refined Width-w NAF)的改进算法FWNAF(Fractional Width-w NAF)算法。该算法利用碎片窗口技

期刊

椭圆曲线密码系统密码芯片算法设计Elliptic curve cryptosystem（ECC） Cryptographic chips Algorith

知识驱动的舰艇编队信息系统顶层设计方法

针对国内大型舰艇编队信息系统总体设计存在的体系结构描述不规范、仿真验证与体系结构设计分离、设计知识缺乏高效管理等问题,参考国内外典型复杂工程系统的顶层设计方法,论

期刊

信息系统知识驱动增量迭代顶层设计information system knowledge driven lncremental Iterate t

转移性三阴性乳腺癌临床治疗进展

三阴性乳腺癌(TNBC)的复发风险高,预后差。超过三分之一的TNBC患者在发病过程中会出现远处转移。尽管长久以来化疗为主要治疗转移TNBC方案,然而,随着用于携带BRCA基因突变(BR

期刊

化疗免疫治疗BRCA突变三阴性乳腺癌

水葫芦生物炭对水溶液中Cu（2＋）的吸附研究

以水葫芦为原料制备生物炭,研究了不同生物炭用量、溶液pH、吸附时间及Cu（2＋）初始浓度条件下的吸附特性,并探讨了吸附机理.结果表明,当Cu（2＋）浓度为200mg·L（-1）时,生物炭适宜用

期刊

水葫芦生物炭铜离子吸附Eichhornia crassipes biochar Cu2＋ adsorption

基于HMM的哈萨克语词性标注研究

与本文相关的学术论文