【摘 要】
:
最大熵模型以其能够较好地包容各种约束信息及与自然语言模型相适应等优点在词性标注研究中取得了良好的效果.因此,将其作为基本框架,提出了一种融合语言特征的最大熵蒙古文
【机 构】
:
合肥学院计算机科学与技术系网络与智能信息处理重点实验室; 内蒙古大学蒙古学学院; 中国科学院合肥物质科学研究院;
【基金项目】
:
国家自然科学基金项目(60763003);教育部人文社会科学研究基金项目(09YZC740045)
论文部分内容阅读
最大熵模型以其能够较好地包容各种约束信息及与自然语言模型相适应等优点在词性标注研究中取得了良好的效果.因此,将其作为基本框架,提出了一种融合语言特征的最大熵蒙古文词性标注模型.首先,根据蒙古文构词特点及统计分析结果,定义并选取特征模板,利用训练语料提取了大量的候选特征集合,针对错误或者无效的特征通过设置一些规则筛选特征.然后,训练最大熵概率模型参数.实验结果表明,融合蒙古文形态特征的最大熵模型可以较好地标注蒙古文.
其他文献
自然条件下,土壤表层污染物随降雨入渗是污染包气带及地下水的一个重要途径。以河北省廊坊市某化工园区为研究区域,通过现场取样及室内试验获取土壤参数,刻画包气带剖面概念
汗是人体正常生理机能的重要表现之一,汗证亦是临床常见病证。汗出异常在多种临床疾病的诊断中具有独特的价值。《内经》有关“汗”的论述内容详尽系统,然而通过对后世文献的
目的探讨肛肠手术术后外用肛泰软膏的疗效。方法将204例接受肛肠手术的手术病人随机分为治疗组102例,对照组102例,对照组术后常规换药,治疗组采用肛泰软膏换药,分别观察两组患者
针对光伏电站发电功率随机性和不稳定性导致的预测难的问题,提出一种基于相似日与进化粒子群优化(EPSO)最小二乘支持向量机(LS-SVM)的发电功率预测模型。考虑到不同天气类型
竞争的开放式环境影响使组织发展在跨组织和跨边界的合作、融合变得越来越重要,在组织创新方面,单个组织或部门由于知识、信息及资源支配的有限性,不得不寻求组织间的合作和
深入研究了中英文指代消解中的待消解项识别问题.在前人工作的基础上,首先使用规则方法识别与上下文无关或具有显著固定模式的非待消解项;针对与上下文相关的非待消解项识别,
2002年10月,党中央、国务院作出了进一步加强农村卫生工作的决定,提出建立新型农村合作医疗制度的要求。2003年,国务院建立了部际联席会议,将浙江、湖北、云南和吉林四个省作
<正>一、中国市场对于EPE包装材料的需求情况EPE(聚乙烯)发泡片包装材料于80年代后期进入中国市场,先于国外如德国、意大利,美国最早使用EPE(聚乙烯)发泡片包装材料。而后,在
本文对心理健康的标准进行了探讨。对不同国家,不同时代的人,心理健康的标准说法不尽相同。人的心理和生理一样,是生命的有机系统,有独特的机制和规律。在心理活动中有些波动和异
<正>《义务教育英语课程标准》指出:"基础教育阶段的目标是以学生语言技能、语言知识、情感态度、学习策略和文化意识的发展为基础,培养学生综合语言运用的能力。""要为学生