隐马尔科夫模型在词性标注问题中的应用

来源 :清华大学 | 被引量 : 0次 | 上传用户:wujuan0902
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先介绍了隐马尔科夫模型,以及它在自然语言处理中的主要应用。然后介绍了隐马尔科夫模型在词性标注这一具体问题中的应用,并在开源语料库PennTreebank上实现了自己的词性标注模型,取得了90.48%的正确率。之后,我们研究了模型的平滑问题,对统计语言模型常见的加1平滑,GoodTuring平滑,Jelinek-Mercer平滑和Katz平滑进行了对比,并对它们进行了总结。最后,我们选择Katz平滑加入到模型中,并成功改善了模型的正确率到91.91%。
其他文献
通过广角X射线衍射(WAXD)和动态力学性能(DMA)测试研究了130℃高温拉伸聚碳酸酯/聚对苯二甲酸乙二醇酯(PC/PET)合金的非晶相分子取向与黏弹性的关系。从微观结构决定宏观性能
研究目的:探讨FTO mRNA在前列腺癌及肾癌中表达水平,并讨论其在前列腺癌及肾癌中表达有无差异。研究方法:(1)采用RT-PCR分别检测前列腺癌肿瘤细胞株和前列腺上皮细胞株FTO基
离子通道是细胞膜蛋白,参与细胞的各种生理过程如细胞电活动、信号转导、增殖、分化、凋亡等。肿瘤细胞膜上也存在离子通道,肿瘤细胞上的离子通道与正常细胞上的离子通道有质或
背景与目的 白血病(leukemia)是最常见的造血系统肿瘤,其本质是造血干细胞的恶性克隆性疾病,特征为原始或幼稚细胞无限增殖,失去了正常的造血调控,并存在分化障碍、凋亡受阻。
生长素(IAA/indole-3-acetic acid)作为植物重要的内源激素之一,广泛参与植物生长和发育的诸多过程,如根系形态建成、营养器官及生殖器官发育、维管束组织的形成和分化,应激
运用文献资料法和归纳法对大学生拓展训练的破冰操作技术特点进行总结,从问好及自我介绍技术操作、拓展训练两大诉求操作技术、团建操作技术和拓展训练体验注意事项四个部分进
本研究所选翻译项目文本为国外篮球媒体BBALLBREAKDOWN的篮球评论。篮球评论语言充满趣味,极富活力,其语言活力的体现之一在于运用了大量隐喻的修辞。鉴于篮球评论表达的这种
有机氯农药曾广泛用于农业害虫与公共卫生防治,虽早已被禁,但如DDT等及其主要代谢产物在自然环境中的残留依然可以检测出来,存在一定的健康与生态风险。谷胱甘肽S-转移酶(GSTs)作为一类保守的具有多种功能的超基因家族酶系,普遍存在生物体中。GSTs主要功能是催化内源、外源等有毒物质形成低毒易溶于水的化合物而排出体外,减少或避免对机体造成损害。本文通过对实验室保存的DDT降解菌Ochrobactrum
近年来,干扰对齐技术因其能够显著提高系统自由度的特点,成为了应用于干扰信道的一种出色的干扰管理方法。此外,随着自干扰消除技术的日益成熟,使得全双工无线通信技术成为可
随着中国“一带一路”战略对中国制造业企业带动作用,中国的电力装备制造业迎来了新的机遇和挑战。此外,基于国家能源传略的转变,构建清洁、高效、安全可靠的现代化能源体系