基于关联度的汉藏多词单元等价对抽取方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:A88833238
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对为汉藏辅助翻译系统建立汉藏多词单元翻译词典这一任务,该文提出了CMWEPM模型。该模型首先依据关联度和结合度来确定汉语语料中多词单元的边界,然后根据词对齐信息分别抽取严格和约束多词单元等价对,从而形成汉藏多词单元等价对。CMWEPM模型根据不同长度和频次对多词单元进行分类,并为不同类型设定不同阈值,最终提高了汉藏多词单元等价对的召回率,从而能够间接地提高汉藏辅助翻译系统的翻译质量。
其他文献
百度百科包含了大量的实体和丰富的链接与分类关系,在中文领域含有大量人类知识,能够弥补普通词典词汇覆盖面小的缺点。在商品品牌名称挖掘中,该文提出了发现新的品牌名称的
要采访谢晋实在不是一件容易的事,这位年逾八旬的国际、国内著名导演,不仅有忙碌的拍片工作,还有频繁的国内外文化艺术交流活动,又有以他名字命名的明星学校、影视学院校长、
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。
该文提出了一种简单、快速的藏文网页文本分类方法。该方法利用网页栏目中词条的类别特征,结合网页文本提取技术,实现了快速、精确地将藏文网页文本归于预定义类别中。实验表
词汇情感消歧是文本情感倾向性分析的关键技术之一.该文在分析比较了词汇情感消歧和词义消歧异同后,从情感分析角度出发,提出了基于图排序的词汇情感消歧方法.该方法通过自动
原料:花鲢鱼头一只2000克,香菇片10克,青菜心12棵。 调料:料酒10克,葱10豆克,酱油10克,糖、味精各3克,盐3克,特级汤400克。 制作:鱼头拆去骨头并保持完整,锅中下油、葱姜及调
说起河南长垣,是个名不见经传的小县。然而,闻名遐尔的“烹饪之乡”,使这个小县象颗璀灿的明珠,镶嵌在中原大地上熠熠生辉。近百年来,一批又一批长垣籍厨师走出长垣,走出河南
期刊
为了从专业领域语料中发现并获取所有的专业术语定义,该文提出了使用分类方法进行专业术语定义抽取的方法。该文采用一种基于实例距离分布信息的过采样方法,将其与随机欠采样
一如电视上天天见到的模样,圆圆的脸上架着眼镜,极富个性的嗓音——与阿彦面对面坐在东广音乐频率一间办公室内,第一感觉就是面前的他比电视中略瘦,也更显年轻帅气。 “小胖