【摘 要】
:
最大熵模型能够充分利用上下文,灵活取用多个特征。使用最大熵模型进行哈萨克语的词性标注,根据哈语的粘着性、形态丰富等特点设计特征模板,并加入了向后依赖词性的特征模板
【机 构】
:
新疆大学信息科学与工程学院; 国家语言资源监测与研究中心少数民族语言中心哈萨克和柯尔克孜语文基地;
【基金项目】
:
国家自然科学基金(No.61063025)
论文部分内容阅读
最大熵模型能够充分利用上下文,灵活取用多个特征。使用最大熵模型进行哈萨克语的词性标注,根据哈语的粘着性、形态丰富等特点设计特征模板,并加入了向后依赖词性的特征模板。对模型进行了改进,在解码中取概率最大的前n个词性分别加入下一个词的特征向量中,以此类推直至句子结束,最终选出一条概率最优的词性标注序列。实验结果表明,特征模板的选择是正确的,改进模型的准确率达到了96.8%。
其他文献
《神学政治论》是斯宾诺莎的名著。在该书中,斯宾诺莎通过区分两种宗教指出当时的宗教为伪宗教,并以科学的方法解释《圣经》,摧毁了伪宗教的基础,驳斥了对《圣经》的两种错误
通过分析调节阀噪音的几种来源,指出阻塞流引起的闪蒸和气蚀是产生流体动力学噪音的根源。利用图形分析了阻塞流引起闪蒸和气蚀的机理,详述闪蒸和气蚀工况调节阀噪音的各种控
眷恋旧传统的自然流露──评福克纳的两篇小说汪海如威廉·福克纳的伟大之处在于他为美国和世界文坛贡献了一套“约克纳帕塌法世系”。从这套包括十五部长篇小说和许多中短篇
目的:探讨耳显微镜下CO2激光治疗外耳道良性肿瘤的手术方法和疗效。方法:对10例外耳道良性肿瘤患者行耳显微镜下CO2激光外耳道良性肿瘤切除术,术后进行疗效评估。结果:所有患
本文结合传播学的内容分析法与语言学的话语分析法,考察和分析香港50年代与80年代的中文报刊广告在文本方面的变化和发展。本研究所采用的语料来自香港历史悠久的报纸——《
<正>现在的年夜饭比过去要丰盛许多,但在我的心里,那肉菜各半的饺子丝毫不比这满桌鸡鸭鱼肉差。年又来了,岁又要长了,容颜开始变老了,越来越不愿意过年了。然而,光阴的流转不
手机依赖是不恰当或者过度地使用手机,并对身心健康造成危害的一种成瘾行为。青少年手机依赖现象已越来越普遍。以往研究对青少年手机依赖的概念、测量、危害及影响因素等进
考察美国"高考"、大学录取方式及其与高中课程的关系,是了解美国高中与大学衔接的重要路径。美国"高考"通过标准化测试(SAT、ACT),对学生的学习兴趣、潜能等品质进行考核;美
90年代美国进行了一场标准化教育运动。这场运动对设置课程内容的标准提出了要求,并制定了美国国家科学教育标准。标准化运动使评价面临许多变化并且带给我们诸多启示。
聚碳酸酯(Polycarbonate, PC)作为一种综合性能优异的热塑性工程塑料,被广泛应用于国民经济的各个行业,但是当面临环境污染和石油紧缺问题时,PC的应用将会受到限制。近年来由