基于格助词和接续特征的藏文自动分词方案

来源 :语言文字应用 | 被引量 : 0次 | 上传用户：ahde2006

【摘要】

：

本文结合藏文各类形态特征 ,首次提出了一种基于格助词和接续特征(BCCF ,BasedonCase auxiliarywordandContinuousFeature)的书面藏文自动分词方案。其总体技术特点是 :在格

【作者】

：

陈玉忠李保利俞士汶兰措吉

【机构】

：

北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,青海师范大学北京100871,北京100871,北京100871,西宁810008

【出处】

：

语言文字应用

【发表日期】

：

2003年01期

【关键词】

：

格助词接续特征藏文分词

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文结合藏文各类形态特征 ,首次提出了一种基于格助词和接续特征(BCCF ,BasedonCase auxiliarywordandContinuousFeature)的书面藏文自动分词方案。其总体技术特点是 :在格助词、接续特征、字性知识库以及词典支持下 ,进行逐级定位的确定性分词。初步测试表明 :这一方案在发现和消除切分歧义、解决未登录词问题 ,进而在提高藏文分词精度方面具有很高的实用价值。 In this paper, we first propose a written automatic Tibetan word segmentation scheme based on the BCCF, Based onCase auxiliaryword andContinuousFeature. The overall technical characteristics are: the deterministic participle of level-by-level positioning under the support of lattice adjunct, adjunct characteristic, character knowledge base and dictionary. Preliminary tests show that this program is of great practical value in finding and eliminating the ambiguity in the disambiguation and in solving the problem of unregistered words and thus in improving the precision of Tibetan word segmentation.

其他文献

基于傅立叶相位分析的卫星云图导风技术

导出云迹风 (Cloud Motion Wind)的传统方法,是用最大相关系数法在间隔30 min的卫星云图序列上计算示踪云的位移,以获得有关高度上风的估计值.但在用这种方法处理1 min间隔云

期刊

傅立叶相位分析云迹风快速区域云图

云南鸡街碱性超基性岩杂岩体中橄榄石的化学成分分带现象

云南鸡街碱性超基性岩杂岩体的主体岩石为岩浆结晶分异作用的产物,形成顺序为霞霓钠辉岩→霓霞岩→磷霞岩.在杂岩体的霓霞岩中发现了1粒具分带现象的橄榄石,从中心到边缘,SiO

期刊

橄榄石成分分带扩散作用云南鸡街碱性超基性岩杂岩体

提高劳动报酬在初次分配中比重的途径研究——基于C-D生产函数的实证分析

笔者从要素投入与要素分配关系的视角,探讨提高劳动报酬在初次分配中比重的途径。通过C-D生产函数构建模型,笔者对要素分配的内在决定因素及各因素变动对劳动报酬占比的影响

期刊

C-D生产函数劳动报酬初次分配

采用1998年7月TIPEX探空加密数据对高原反气旋环流特征分析

该文采用1998年7月青藏高原大气科学试验(TIPEX)的中、西部改则和狮泉河新增加密探空资料、国家常规探空资料及NCEP再分析资料等,讨论青藏高原上空的环流特征.结果表明:当没

期刊

TIPEX加密探测高原暖性反气旋水汽输送

一种新的分层冻胀量观测方法及其在季节冻土区的应用

Observation of delamination frost-heave is of significance in the study of foundation frost damage. The three main methods of observing delamination frost-heave

期刊

delamination frost-heave amountantithesesseasonal frozen area

小兴安岭过去500O年的泥炭δ13C记录

小兴安岭植物体中δ13C不仅受区域湿度变化控制,也受温度变化控制.泥炭纤维素的δ13C曲线,较好地响应了小兴安岭地区过去5000年来气候,特别是温度和湿度的演变过程.5.1～3.0 ka

期刊

泥炭小兴安岭气候波动

林业信息系统体系构建分析

随着林业各种特征信息的采集和处理的标准化,以地理信息系统为中心的“3S”一体化技术及网络技术为基础,采用现代科技方法,建立高精度的林业空间信息管理数据库,方便林业部门

期刊

3S技术综合信息系统可持续发展动态林业

Pilot Study on the Nano-Composites Coats of Radar Wave's Absorption

该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥

期刊

nano-compositescoats of wave's absorptionqptimum design

“陆地水”语义场的演变及其同义语素的叠置

“陆地水”语义场具有显著的时代差别。它从夏至清的演变 ,既表现为词的数量的变化 ,也表现为同义语素叠置的产生和复杂化 ,与政治是否统一、人群活动的地域、民族融合等有密

期刊

陆地水语义场演变语素叠置

GIS拓扑关系中广义Euler公式的理论导出及应用

结合GIS专业,引入了可以包括复连通区域的群的概念.在此基础上,使用数学方法推导并证明出GIS拓扑关系中的广义Euler公式,证明了该公式的性质,阐述了利用Euler公式和广义Euler公式进行多边形图拓扑信息自动生成的数学原理及拓扑信息正确性检验的方法,给出真节点-链-岛-群之间的定量关系,同时把全球赤平极射投影引入到地理信息系统中,定义了“海”的概念,将赤平极射投影中球面的极射点代替GIS中平

期刊

Euler公式广义Euler公式赤平极射投影GIS拓扑信息

基于格助词和接续特征的藏文自动分词方案

与本文相关的学术论文