汉英双语标注集的研究与实现

来源 :情报学报 | 被引量 : 0次 | 上传用户:lcy38
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标注集是任何自然语言处理研究中的知识表达基础。本文结合汉英双向机器翻译开发各双语语料库加工的实践,提出了建立标准的汉英双语标注集的必要性,探讨了该标注集设计过程中遇到的几个关键问题并给出了一个比较完备的汉英双语标注集解决方案。实践证明,该方案具有良好的开放性和兼容性,对于汉英双向机器翻译系统和汉英双语语料库研究都具有适用性。
其他文献
但凡跟地震沾上边,都是急茬的!地震预报不必说了,震前预警逼到了秒级,震后速判更是风急火燎:政府-要立即掌握破坏情况,组织救援;公众-要尽快知道地震趋势,安排生活;专家-满腹经纶,顿时语塞。常言,事非经过不知难。震后速判比医院急诊科的压力还大,绝对是个前后夹击的活计:对主震的速判,是马后快炮;对余震的速判,是预测预报。震后的紧急时刻,没人愿听
<正> 苏(苏州)通(南通)长江大桥估计:2007年能建成通车,到那时,南通到上海90公里全程高速,车程仅需1个小时。在南通,一位青年白领一本正经地告诉我:“大桥通车后,我们五点钟
大火成岩省的形成受控于多种因素,包括异常的地幔温度、易熔饱满组分的存在、地幔源中的挥发分和减压的程度。在一个具体大火成岩省中,所有的因素缺少完整的检验导致了地幔柱
中国地震学会地震预报专业委员会与中国科学院力学研究所和青海省地震局于2019年8月26—28日在青海海东市联合举办了中国地震预报论坛2019年学术交流会。来自全国行业内外的150名代表参加了此次学术交流。大会设置了8个专题;共交流报告50篇,其中,口头报告30篇,张贴展板20篇;30篇口头报告中,特邀口头报告9篇,行业系统外口头报告7篇,行业内雏鹰报告9篇。除了一贯的最佳张贴报告评选之外,大会还对
信息网络将是信息化社会发展的必然趋势,分布式数据库管理系统是未来网络文献数据库发展的潮流。分布式数据库不同于集中式数据库管理系统,也不是简单的数据的分散管理,而是分布
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其
有关查全率与查准率关系的研究与争论,从20世纪60年代一直延续至今,还未得出统一的结论。原因之一就是没有令人信服的检索实例。本文试图从一些检索实例揭示查全率与查准率之间
绘本阅读教学,并不是简单的对画面进行临摹,也不是简单的进行文字模仿,更不是单一的为了练习而进行盲目的阅读。而是通过将绘本与阅读进行联合,构建一个与学生言语图式以及实践表
Java是伴随WWW的服务而产生的,人们迫切需要了解Java的基本情况,Java到底是什么语言?它的优势和特点是什么?本文对Java的起源、语法、资源以及和Java有关的一些重要概念做了简要介绍,并对Java的运行环境,Java与C,C++及Netscape的
我国是一个统一的多民族国家,除汉族外,还有55个民族,约占全国人口的6.7%.“少数民族”,是对我国汉族以外人口居少数的民族的总称.少数民族和汉族一样有着悠久的历史,他们在