基于最大熵和HMM的藏文新词识别对比研究

来源 :青海师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户：liupengo0308

【摘要】

：

藏文新词在科技、新闻和网络等领域不断出现，对藏文自动分析带来了挑战．本文将使用序列标注方法来识别藏文新词，首先用规则方式将时间词、数词、后接成份嵌入到统计模型中，然后利

【作者】

：

色差甲贡保才让才让加

【机构】

：

青海师范大学藏文信息处理教育部重点实验室、青海师范大学藏文信息处理与机器翻译省级重点实验室

【出处】

：

青海师范大学学报(自然科学版)

【发表日期】

：

2018年1期

【关键词】

：

藏文新词最大熵模型 HMM模型自动分词

【基金项目】

：

国家自然科学基金(61063033,61662061);教育部重点实验室项目(教技函[2010]52号);教育部“创新团队发展计划”滚动支持计划(IRT_15R40);青海省重点实验室项目(2013-Z-Y17、2014-Z-Y32、2015-Z-Y03);青海省科技厅项目(2015-SF-520)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

藏文新词在科技、新闻和网络等领域不断出现，对藏文自动分析带来了挑战．本文将使用序列标注方法来识别藏文新词，首先用规则方式将时间词、数词、后接成份嵌入到统计模型中，然后利用统计学习的方法对包括新闻、法律、小说、诗歌、中小学教材和地名等多种题材的共15万藏文句子进行统计建模，最后对3087句（其中包含12348个新词）开放语料进行测试，实验结果表明将规则嵌入到最大熵模型比嵌入到HMM模型中的正确率、召回率、F值分别高1．772、0．3905、1．0912个百分点，对于藏文新词识别最大熵模型优于HMM模型．

其他文献

住宅小区建设项目进度控制研究

进度控制在合同规定的工期内，以事先拟定的合理且经济的进度计划为依据，对整个建设过程在时间上进行监督、检查、调整的行为过程，称为进度控制。工程进度管理的具体工作就是甲方

期刊

住宅小区建设项目进度控制

优化水库调度提高水能利用率

近年来，新丰江发电公司水库调度环境发生了根本性改变，功能调整正在强化。在此新形势下，必须对水库优化调度进行调研分析和技术论证，制定出指导性原则；这样才能提高水能利用率，节约

期刊

水库优化调度水能利用率水库调度电力系统安全环境污染可持续发展效益最大化发电公司

烹饪诀窍20则

期刊

盐水鸭发酵面团中沸点又香凤仙汤中色香味离火加盐后下

山区县域聚落演化的空间分异特征及其影响因素——以豫西山地嵩县为例

综合运用GIS空间分析、地形起伏度和地形位指数等方法,分析了1975-2015年嵩县聚落演化的空间分异特征,进而运用因子分析、地理探测器和多元回归分析方法研究了影响因素及其变

期刊

山区聚落聚落演变聚落区位城镇化豫西山地嵩县

社会资本对企业资本结构周期性变动幅度的影响——基于中国上市公司的实证检验

以2005--2014年中国沪深两市A股全行业上市公司为样本，实证检验了企业资本结构的周期性变动特征，以及社会资本对不同所有权性质企业的资本结构周期性变动幅度的影响。结果表明：

期刊

社会资本经济周期资本结构融资需求

使君子大黄粉治小儿蛔虫

期刊

大黄粉使君子蛔虫病驱虫率不超过

水电站智能化体系研究

智能电网是国家电网新提出的一个概念，阐述了作为智能电网中发电侧的智能化水电站的内涵和特点及国内外的研究现状，并着重介绍了智能化水电站的结构和功能。图2幅，表1个。

期刊

智能电网智能化水电站互动能量管理系统

环境工程技术专业高职教育教学改革的探讨

国务院印发《国家职业教育改革实施方案》(国发[2019]4号,简称职教20条),对职业教育提出了全方位的改革设想。本文通过调研环境工程技术专业人才市场需求,结合职教20条,分析

期刊

高职院校环境工程技术发展现状改革途径

通用设计一值得关注的家电创新之路

通用设计的家电，不但适合普通人，而且也适合残疾人和老年人使用。家电通用化将会带来可能超越我们想象的社会效益和经济效益。家电通用设计应从对“人”及其生活方式、价值观念

期刊

工业设计家用电器通用设计产品创新

SPECT核素心肌灌注显像在稳定型心绞痛定位及诊断中的应用价值探讨

目的分析SPECT核素心肌灌注显像在稳定型心绞痛定位及诊断中的应用价值。方法回顾性分析2014年3月-2017年6月期间我院收治的72例拟诊稳定型心绞痛患者的临床资料,所有患者均

期刊

稳定型心绞痛SPECT核素心肌灌注显像定位诊断效果

基于最大熵和HMM的藏文新词识别对比研究

与本文相关的学术论文