基于判别式分类和重排序技术的藏文分词

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yuyu198995
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响.在构词粒度方面,分别考察了以基本字丁、基本字丁—音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构词粒度分词的F值最高,为91.21%;在分词结果重排序方面,提出一种基于词图的最短路径重排序策略,将判别式解码生成的切分结果压缩为加权有向图,图中节点表示音节间隔,而边所覆盖的音节作为候选切分并赋予不同权重,选择一条最短路径从而实现整句切分,最终分词结果的F值达到96.25%.
其他文献
本实验目的是研究猴免疫缺陷病毒(SIV)引起多形核嗜中性白细胞(PMNs)凋亡的机理。实验用PCR技术扩增gag基因,用Western blot法测定p53和bcl-2基因的表达。结果显示PMNs在被SIV感染
为了探讨腺病毒(adenovirus,Ad)E1B 55kD癌蛋白(Ad E1B 55kD)打破hDaxx和PML共定 位细胞核的作用机制,本文利用体内外共免疫沉淀反应研究Ad E1B 55kD与hDaxx的结合反应 ,并通
华佗十全酒,原名是十全大补酒,是“冬天进补,春天打虎”保健酒著名品牌之一,风靡全国半个多世纪。
那片灰色的房子 那个门前的水坑 多少次趟过草棵 多少次射出弹弓
从杭州、兰州两地各一例乙型肝炎病毒(HBV)表面抗原阳性血清中提取病毒DNA,采取PCR技术扩增出前表面抗原(preS)基因片段,重组到质粒载体上,对该基因进行了全序列测定[GenBank索取号
腊月初八,天寒地冻。眼看着外面寒风凛冽,我早已裹上了厚厚的棉衣,可爱的女儿却人小鬼大,仍然“要风度,不要温度”,穿着裙可真是美丽“冻”人。我这个做妈的虽然勉强发扬着民
期刊
将汉滩病毒囊膜糖蛋白G1与核蛋白(NP)部分片段以不同方式拼 接,构建G1S0.7或S0.7G1嵌合基因,分别插入杆状病毒表达载体pFBD,转化DH10Bac致敏菌, 获得含有嵌合基因的重组穿梭
幽门螺杆菌cagA基因克隆到杆状病毒表达系统的pBlueBacHis2A转移载体中,将重组质粒pBlueBacHis2A-CagA与亲本病毒Bac-N-blue DNA共转染Sf9细胞,以空斑法纯化获得的重组杆状病
在大肠杆菌中对汉滩病毒S基因4种不同长度片段的重组表达质粒进行诱导表达。结果表明表达的4种GST-NP融合蛋白均以不溶性包含体形式存在于茵体细胞内,表达量分别占菌体蛋白总量的29-36%,分子量
罐焖牛肋肉此菜的精华所在是其汁酱的制作十分独特,选用美国牛肉味道最浓的牛脊骨髓,韩国的高丽人参熬制10多小时而成。牛肉选用美国牛肋骨肉中最嫩的部分,为了不使其香味流失,特