双语平行语料相关论文
在自然语言处理领域,双语平行语料库的重要性日益加强,其研究工作主要是集中在构建、对齐和标注等方面。它在在机器翻译、词典编纂、......
在统计机器翻译中,领域问题对翻译系统的性能具有很大影响,当训练语料与测试语料来自同一领域时,翻译效果比较好,反之则翻译性能会下降......
近年来,互联网信息的爆炸式增长给了统计机器翻译新的契机,众多研究团体和商业机构开始从互联网上获取大规模的双语语料。机器翻译模......
本文阐述了国家标准GB/T 40035-2021《双语平行语料加工服务基本要求》的制定背景和标准整体框架结构,对标准的主要内容和技术要求......
针对专利资源,研究一种有效地从专利数据库中获取高质量双语对译语料的方法。该方法利用网页的URL命名特点获取专利数据的详细网页,......
汉语缩略语在现代汉语中被广泛使用,其相关研究对于中文信息处理有着重要的意义.本文提出了一种从英汉平行语料库中自动提取汉语缩......
双语句子对齐指的是将篇章级对齐的双语语料转换成句子级对齐的双语平行语料.双语句子对齐可采用计算机程序自动实现,但根据文本语......
去除重复网页一直是信息检索领域的一个待解决的问题.本文基于双语文章的内容,提出了一种抽取特征词和特征句,判别跨语言重复网页......
双语平行语料库是统计机器翻译及其一系列相关研究应用不可或缺的重要资源。传统的人工校验、录入平行语料的方式不仅耗时费力,而且......