融合词预测的半监督老挝语词性标注研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:birdlay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为有效对老挝语进行词性标注,提出一种融合词预测的半监督隐马尔科夫词性标注方法.首先,为解决未登录词标注问题,基于长短期记忆网络建立词预测模型,并改进维特比算法来将词预测模型融入隐马科夫模型中;其次,为提高隐马科夫模型标注的准确率与速度,使用规则与统计相结合的方法.制定了详细的老挝语法规则集,并将规则集与隐马科夫模型进行结合;再有,为扩展老挝语词性标注语料库规模,使用半监督学习方法,以得到正、反半监督隐马科夫模型;最后,为了解决隐马科夫模型未考虑后续词性对当前标注影响问题,使用正、反半监督隐马科夫模型进行词性标注,并优化了标注结果.实验结果证明,该方法可以有效标注老挝语词性,准确率达到92. 55% .
其他文献
预测蛋白质结构对药物设计和疾病诊断有着重要的科学意义.针对蛋白质结构从头预测问题,在进化算法框架下,提出一种距离和疏水模型辅助的蛋白质结构预测方法( Distance and Hy
该文通过阐述研讨会的精华,并加入作者自己独到的见解,向我们展现了客家聚落的文化内涵,为今后对相关学科的研究,起到了启迪的作用.
耦合映象格子系统将混淆和扩散很好地结合在一起,这种结合可以被用来设计Hash函数及序列密码,极具密码学应用价值,而耦合映象格子系统参数直接影响密码学性能.选用帐篷映射作为耦合映象格子系统的非线性函数,通过数值仿真详细分析系统参数变化对耦合映象格子系统所产生序列的随机特性、差值分布特性、相空间结构、不变分布特性、序列复杂性、Lyapunov指数、自相关特性、互相关特性等的影响,为密码系统设计提供参考
介绍了一种可用于工业现场控制的串行通信方法,讨论了PC机与单片机通信的设计方案,并利用C++Builder 5.0实现了PC机的软件编程.
3月23日下午,湛江国联水产开发股份有限公司(国联水产)发布关于控股股东及主要股东协议转让部分股份的提示性公告,控股股东向永辉超市转让10%股份.
期刊
迂回曲折的赛道,风驰电掣的速度,缤纷绚丽的色彩,不绝于耳的轰鸣;赛车界至高无上的国家荣誉,24国的顶级赛车精英,最新科技武装的引擎动力,喷涌而出的胜利香槟……这,就是有着
谷物品质与谷物食品实验室 ,是黑龙江省科委首批批准建设的开放实验室 ,依托在黑龙江省农业科学院谷物品质研究中心 ,1997年通过复查评审验收 ,正式命名授牌。并于 1995年通
期刊
本设计运用单片机,结合语音识别芯片LD3320,利用语音输入完成控制信号输入,通过语音、数码管、继电器和传感器的反馈完成输出。该设计的语音命令平均正确识别率可达90%。在智
在工程建设中,造价管理是对项目所需费用的全过程管理、确定以及控制,其可以帮助建设企业合理控制预算,提高资源的使用效率,进而实现工程经济效益最大化。本文主要针对基于BI