基于格助词和接续特征的藏文自动分词方案

来源 :语言文字应用 | 被引量 : 0次 | 上传用户:ahde2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文结合藏文各类形态特征 ,首次提出了一种基于格助词和接续特征(BCCF ,BasedonCase auxiliarywordandContinuousFeature)的书面藏文自动分词方案。其总体技术特点是 :在格助词、接续特征、字性知识库以及词典支持下 ,进行逐级定位的确定性分词。初步测试表明 :这一方案在发现和消除切分歧义、解决未登录词问题 ,进而在提高藏文分词精度方面具有很高的实用价值。 In this paper, we first propose a written automatic Tibetan word segmentation scheme based on the BCCF, Based onCase auxiliaryword andContinuousFeature. The overall technical characteristics are: the deterministic participle of level-by-level positioning under the support of lattice adjunct, adjunct characteristic, character knowledge base and dictionary. Preliminary tests show that this program is of great practical value in finding and eliminating the ambiguity in the disambiguation and in solving the problem of unregistered words and thus in improving the precision of Tibetan word segmentation.
其他文献
导出云迹风 (Cloud Motion Wind)的传统方法,是用最大相关系数法在间隔30 min的卫星云图序列上计算示踪云的位移,以获得有关高度上风的估计值.但在用这种方法处理1 min间隔云
云南鸡街碱性超基性岩杂岩体的主体岩石为岩浆结晶分异作用的产物,形成顺序为霞霓钠辉岩→霓霞岩→磷霞岩.在杂岩体的霓霞岩中发现了1粒具分带现象的橄榄石,从中心到边缘,SiO
笔者从要素投入与要素分配关系的视角,探讨提高劳动报酬在初次分配中比重的途径。通过C-D生产函数构建模型,笔者对要素分配的内在决定因素及各因素变动对劳动报酬占比的影响
该文采用1998年7月青藏高原大气科学试验(TIPEX)的中、西部改则和狮泉河新增加密探空资料、国家常规探空资料及NCEP再分析资料等,讨论青藏高原上空的环流特征.结果表明:当没
Observation of delamination frost-heave is of significance in the study of foundation frost damage. The three main methods of observing delamination frost-heave
小兴安岭植物体中δ13C不仅受区域湿度变化控制,也受温度变化控制.泥炭纤维素的δ13C曲线,较好地响应了小兴安岭地区过去5000年来气候,特别是温度和湿度的演变过程.5.1~3.0 ka
随着林业各种特征信息的采集和处理的标准化,以地理信息系统为中心的“3S”一体化技术及网络技术为基础,采用现代科技方法,建立高精度的林业空间信息管理数据库,方便林业部门
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
“陆地水”语义场具有显著的时代差别。它从夏至清的演变 ,既表现为词的数量的变化 ,也表现为同义语素叠置的产生和复杂化 ,与政治是否统一、人群活动的地域、民族融合等有密
结合GIS专业,引入了可以包括复连通区域的群的概念.在此基础上,使用数学方法推导并证明出GIS拓扑关系中的广义Euler公式,证明了该公式的性质,阐述了利用Euler公式和广义Euler公式进行多边形图拓扑信息自动生成的数学原理及拓扑信息正确性检验的方法,给出真节点-链-岛-群之间的定量关系,同时把全球赤平极射投影引入到地理信息系统中,定义了“海”的概念,将赤平极射投影中球面的极射点代替GIS中平