基于词典和统计的语料库词汇级对齐算法

来源 :情报学报 | 被引量 : 0次 | 上传用户:seraphim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词的共现统计信息以最大的互信息寻找对齐词汇以及相邻短语。实践证明该方法是行之有效的
其他文献
新型旋转鼓风干燥机主要由空气调节气泵、物料投放装置、干燥箱、燃气炉、布袋除尘器和过热水蒸气回收装置等六部分组成,用于干燥物料。该装置在干燥箱转筒夹层中设计了蛇形
化学物质登记数据库(REGISTRY)和化学文摘数据库(CAplus)是STN系统中两个主要的信息源,是检索化学化工领域最重要的数据库,但是检索费用比较昂贵,尤其是化学结构检索。因此如何经济有效地检索这两个数
《地震科学进展》期刊简介:本刊由中国地震学会和中国地震局地球物理研究所联合主办,2020年第1期将由原刊名变更为本刊名,是地震科学研究与技术发展类月刊。本刊是地震系统发
本文提出了由要素维、领域维、层次维和利害关系人维构成的信息伦理的四维架构理论.四个维度各有理论上需要研究和解决的问题,并从整体上标示出信息伦理领域的主要知识范畴.
伴随社会经济的不断发展,农业产业结构也在持续性变化。而且,人们的生活品质也得到有效提升,对于蔬菜的质量以及食品的安全问题越加的重视。因此,无公害蔬菜得到了人们更多的
但凡跟地震沾上边,都是急茬的!地震预报不必说了,震前预警逼到了秒级,震后速判更是风急火燎:政府-要立即掌握破坏情况,组织救援;公众-要尽快知道地震趋势,安排生活;专家-满腹经纶,顿时语塞。常言,事非经过不知难。震后速判比医院急诊科的压力还大,绝对是个前后夹击的活计:对主震的速判,是马后快炮;对余震的速判,是预测预报。震后的紧急时刻,没人愿听
<正> 苏(苏州)通(南通)长江大桥估计:2007年能建成通车,到那时,南通到上海90公里全程高速,车程仅需1个小时。在南通,一位青年白领一本正经地告诉我:“大桥通车后,我们五点钟
大火成岩省的形成受控于多种因素,包括异常的地幔温度、易熔饱满组分的存在、地幔源中的挥发分和减压的程度。在一个具体大火成岩省中,所有的因素缺少完整的检验导致了地幔柱
中国地震学会地震预报专业委员会与中国科学院力学研究所和青海省地震局于2019年8月26—28日在青海海东市联合举办了中国地震预报论坛2019年学术交流会。来自全国行业内外的150名代表参加了此次学术交流。大会设置了8个专题;共交流报告50篇,其中,口头报告30篇,张贴展板20篇;30篇口头报告中,特邀口头报告9篇,行业系统外口头报告7篇,行业内雏鹰报告9篇。除了一贯的最佳张贴报告评选之外,大会还对
信息网络将是信息化社会发展的必然趋势,分布式数据库管理系统是未来网络文献数据库发展的潮流。分布式数据库不同于集中式数据库管理系统,也不是简单的数据的分散管理,而是分布