基于未对齐汉英双语库的翻译对抽取

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zap6872
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究基于未对齐的汉央双语库翻译对抽取。文章首先介绍了Pascale Fung在这方面设计的两个算法。在此基础上,文章对后一种算法进行了部分的改进,使得其更适合于真实双语文本的翻译对抽取。实现结果表明改进后算法的有效性。本方法可以用于基于大规模双语语料库的短语翻译抽取、词典编纂等应用,具有较高的应用价值。
其他文献
<正>在转换企业经营机制、深化经济改革的工作中,企业必须面向市场,练好内功,加强企业的内部管理,积极开发出市场需求的价廉物美的产品,努力降低成本,以增强企业的后劲和市场
食醋和鸡蛋是两种营养食品,当鸡蛋浸入食醋后,生鸡蛋中各种有害微生物被杀灭,同时鸡蛋中钙、铁、钴、锌被溶出,蛋膜蛋清中溶菌酶被释放,蛋白质肽链部分断裂,蛋黄中释放卵磷脂
<正> 淀粉是以葡萄糖为单位组成的一种高分子聚合物。未经糊化面制品其淀粉分子结构呈微晶束定向排列。这种淀粉结构状态称为β型结构。淀粉结构呈β型的面制品通过蒸煮或挤
家庭中使用的各种电动洗衣机,在使用过程中经常发生漏水现象,这不仅会给使用者增添烦恼,严重的话漏水还会流淌到电动机中去,使电动机绕组间的绝缘电阻下降,引起洗衣机外壳漏
分词词典是汉语信息处理系统的一个基本组成部分,其查询和更新效率将直接影响汉语信息处理系统的性能.本文采用PATRICIA tree的数据结构,设计了一种可以对词典词条进行快速查
随着电子文本的大量涌现,人们对信息检索工具提出了更高的要求。本文介绍一种扩展的布尔检索模型及其在中文信息检索系统中的应用,并利用相关反馈技术改善检索系统性能。
豆腐乳又名酱豆腐,亦称乳腐。是我国传统发酵食品之一,已有一千余年的生产历史。全国各地均有生产,风味各有特色,归纳起来大致分为咸味、甜味和辣味三大类。若从色泽上划分则
本文的内容是在1998 年中文信息处理国际会议小组讨论上发表的基础上加工而成。本文主要讨论了我公司最近研发的英日自动翻译系统中日语生成模块的一些理论和实践问题。主要包括
实达电脑公司成立五年多了.一个人员很少,资金甚微的小公司,每年却以税利翻两番的速度增长,到1993年产、销总额都近4亿元,人均创税利20万元,公司被评为福州市先进标兵企业,成
手写体汉字特征一般在几百维以上,在这样的高维空间中,汉字样本是如何分布的?本文从可视化的角度对这一问题进行了探讨。论文首先给出了所选用的汉字特征的定义,然后对一些具有代