基于词典的汉藏句子对齐研究与实现

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:clone111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,针对藏文语言的特殊性,提出基于词典的汉藏句子对齐。整理了对齐所用双语词典,并对其词语覆盖率进行了评价。在汉藏句子对齐过程中发现汉语与藏文的分词粒度不同的问题,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。
其他文献
目的阐述非导尿法在处理产后尿潴留中的应用。方法采用膀胱区热敷按摩加足三里注射新斯的明法促使病人排尿。结果138例患者均在15~30min内排尿。结论膀胱区热敷按摩加足三里注
课堂提问是一种教学手段,更是一种教学艺术。新课程改革背景下数学教学需要做出不断的创新和调整,寻求更加科学有效的教学方法,提问教学策略可以很好地满足新课改的理念与要
分词是汉语自然语言处理研究中非常重要的一个环节,在早先的研究中,最大熵模型和条件随机场(CRF)模型已经广泛运用到汉语自动分词的工作中。最大间隔马尔可夫网(M3N)模型是近年来由
面向移动终端的统计机器翻译需求越来越多,但无浮点运算单元的处理器限制了翻译速度。该文提出了一种对统计机器翻译解码运算的定点化运算方法,缓解了无浮点运算单元的处理器
本文对人参疫病菌进行杀菌剂室内毒力测定,参根接种试验及田间药剂筛选试验,结果表明:瑞毒霉500倍液和1000倍液参苗消毒,其防治效果分别达到81.4%和70.1%,甲霜灵锰锌500倍液防
耐多药结核病(MDR-TB )是所有结核病中最为严重的一种类型,人类将因此在21世纪面临较20世纪50年代中叶更为严峻的结核病疫情.而在实际工作中,结核病临床和防治的专业人员也越
俗话说:"水能载舟,亦能覆舟".临床上常用的药物亦具有这种特性,使用得当它可以解除病人疾苦,造福人类,反之,它还可以引起严重的不良反应、甚至危及生命.如何预防或减轻这些不
本篇文章将会站在行政法的角度详细论述所有高校与大学生之间所存有的法律关系,普遍认为他们两者之间存在一定的行政法律关系,因此,剖析了此种行政法律关系中的每个相关要素,
人参花叶病是近些年来引起人们重视的一种病害。随着人参生产面积和栽参区域的不断扩大,人参花叶病的发展有加重趋势。目前各人参产区均有发生,严重者达80%以上,现已成为影响
我院自1996~1998年共收治耻骨联合分离25例,应用钢丝内固定治疗16例,疗效较好。本组16例中男性9例,女性7例。年龄20~50岁。手术在全麻下进行,以使肌肉充分松驰,便于整复。于耻骨联合