基于最大熵的维吾尔语句子边界识别模型

来源 :计算机工程 | 被引量 : 0次 | 上传用户:taodenmy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用最大熵模型实现维吾尔语句子边界识别,该模型的训练过程不需要提供手工收集规则、词性标注及形态分析,仅使用较容易获取的单词长度和音节等特征。为确定最佳特征模板,在特征空间上组合出不同特征模板进行测试。实验结果表明,最佳特征模板具有较强的鲁棒性,召回率可达97.72%。 The maximum entropy model is used to realize UWL sentence boundary recognition. The training process of the model does not need to provide manual collection rules, part of speech tagging and morphological analysis, and only uses the easy-to-obtain word length and syllables. To determine the best feature template, different feature templates are combined in the feature space for testing. Experimental results show that the best feature template has strong robustness and the recall rate can reach 97.72%.
其他文献
利益相关者理论是在反思、批判传统企业理论基础上发展起来的,它强调企业不仅要对股东负责,还要承担对利益相关者的责任。利益相关者理论强化了企业承担社会责任的必要性,明
本文结合中国传统文学艺术创作与批评实际,对“和”之美的两种重要生成形态——“两极兼融”之美、“多元合一”之美及与其相关的具体表现形态(特别是“集大成”之美)谈谈浅
国际减排的方案制定是全球应对气候变化的关键问题,也是当前各国的争端所在.基于MRICES(LRICES)模型,对配额原则下的"丹麦草案"、人均排放权均等方案以及排放水平控制原则下
对技术物体构建的空间内涵的理解,应基于以下两点:动态性,表现在空间是其演化中显现的空间逻辑性内容和技术样品静态空间连接起来所反映的谱系空间;事件性,技术事件表示的是
基于关联理论的基本原则,阐释电影片名中出现的文化差异在构建最佳关联的过程中的语义特征及语义层次关系结构,探寻英语电影片名中文化差异因素的基本关联机制及其运行规律.
在分析国内外信息系统学科现状的基础上,介绍了由教育部高等学校管理科学与工程类学科专业教学指导委员会、国际信息系统协会中国分会(CNAIS)和清华大学出版社共同组织“中国
语用学与修辞学都研究言语交际,关注为达到交际目的而进行的语言手段的选择。但是由于不同的学术传统,语用学和现代修辞学在研究的侧重点和研究方法上还存在很大的差异。从跨
目的 探讨不同方式球囊扩张治疗环咽肌失弛缓所致吞咽障碍的疗效及作用机制.方法 共选取30例脑干梗死后吞咽障碍患者,经吞咽X线荧光透视检查(VFSS)均证实为环咽肌失弛缓.采用
将蓄能装置引入到基于超结构方法的分布式联供系统优化配置混合整数线性规划模型之中,所得模型可实现系统结构和运行同步优化、各设备与蓄能装置同时优化,采用分枝定界法结合
首先引入“加性方法”及“权重稳定区间”的概念,给出了“加性方法”保持方案排序稳定的“权重稳定区间”.根据提出的“权重稳定区间”的分析方法,可以解释一类加性方法因权