基于最大熵和HMM的藏文新词识别对比研究

来源 :青海师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:liupengo0308
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏文新词在科技、新闻和网络等领域不断出现,对藏文自动分析带来了挑战.本文将使用序列标注方法来识别藏文新词,首先用规则方式将时间词、数词、后接成份嵌入到统计模型中,然后利用统计学习的方法对包括新闻、法律、小说、诗歌、中小学教材和地名等多种题材的共15万藏文句子进行统计建模,最后对3087句(其中包含12348个新词)开放语料进行测试,实验结果表明将规则嵌入到最大熵模型比嵌入到HMM模型中的正确率、召回率、F值分别高1.772、0.3905、1.0912个百分点,对于藏文新词识别最大熵模型优于HMM模型.
其他文献
进度控制在合同规定的工期内,以事先拟定的合理且经济的进度计划为依据,对整个建设过程在时间上进行监督、检查、调整的行为过程,称为进度控制。工程进度管理的具体工作就是甲方
近年来,新丰江发电公司水库调度环境发生了根本性改变,功能调整正在强化。在此新形势下,必须对水库优化调度进行调研分析和技术论证,制定出指导性原则;这样才能提高水能利用率,节约
综合运用GIS空间分析、地形起伏度和地形位指数等方法,分析了1975-2015年嵩县聚落演化的空间分异特征,进而运用因子分析、地理探测器和多元回归分析方法研究了影响因素及其变
以2005--2014年中国沪深两市A股全行业上市公司为样本,实证检验了企业资本结构的周期性变动特征,以及社会资本对不同所有权性质企业的资本结构周期性变动幅度的影响。结果表明:
智能电网是国家电网新提出的一个概念,阐述了作为智能电网中发电侧的智能化水电站的内涵和特点及国内外的研究现状,并着重介绍了智能化水电站的结构和功能。图2幅,表1个。
国务院印发《国家职业教育改革实施方案》(国发[2019]4号,简称职教20条),对职业教育提出了全方位的改革设想。本文通过调研环境工程技术专业人才市场需求,结合职教20条,分析
通用设计的家电,不但适合普通人,而且也适合残疾人和老年人使用。家电通用化将会带来可能超越我们想象的社会效益和经济效益。家电通用设计应从对“人”及其生活方式、价值观念
目的分析SPECT核素心肌灌注显像在稳定型心绞痛定位及诊断中的应用价值。方法回顾性分析2014年3月-2017年6月期间我院收治的72例拟诊稳定型心绞痛患者的临床资料,所有患者均