句子对齐相关论文
句子级对齐双语语料是自然语言处理的重要资源之一,对于机器翻译、跨语言检索、双语词典编纂等研究有很大应用价值.关于自动句子对......
会议
通过互联网获取的句对齐平行语料常存在对齐错位或译文质量差的问题,针对这一问题,本文提出了一种基于反向翻译的汉语–土耳其语平......
【目的】实现双语句子的自动对齐,为构建双语平行语料库、跨语言信息检索等自然语言处理任务提供技术支持。【方法】将BERT预训练......
为降低多源信息背景下平行语料库重复句段对翻译工作的干扰,提升去重效率,设计一种基于词频-逆向文件频率技术的平行语料库相似句......
双语平行语料是进行机器翻译研究不可缺少的资源,而句子对齐是双语语料处理的第一步。本文在深入研究了中英文各自特点的基础上,分别......
自然语言处理的许多研究都是从大规模的语料库提取语言知识的规律,然后利用这些规律来指导自然语言处理的过程。双语语料库含有两种......
随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行......
双语语料库是存放两种语意对齐的语料资源和信息的仓库,是机器翻译和多语言处理的重要资源,被广泛的应用于机器翻译、机助人译、翻......
双语语料库在基于实例的机器翻译,翻译知识的获取,双语词典的建立,词义消歧等领域有着重要的应用价值。大规模双语语料库的建设是......
双语资源在计算语言学研究领域具有十分特殊的地位,对机器翻译、双语词典编纂、术语抽取、跨语言信息检索等研究和应用提供了有力......
近年来,互联网信息的爆炸式增长给了统计机器翻译新的契机,众多研究团体和商业机构开始从互联网上获取大规模的双语语料。机器翻译模......
近些年来,在语言信息处理研发、双语教学和对比研究以及双语词典编纂研究中,双语语料库的作用日益凸显出来.在双语语料库中,不仅要......
本文主要描述了在自然语言处理中汉语-维吾尔语的句子级对齐系统的设计与实现.系统主要实现对维语和汉语的句子边界进行识别、对于......
随着中老两国关系的扩大和深入,加强汉语-老挝语之间的学术研究具有十分重要的现实意义。在自然语言处理任务中,平行语料库为统计......
构建双语平行语料库是实现基于实例的机器翻译的主要工作,而实现双语语料的对齐则是构建双语平行语料库的基础.主要目标是针对英语......
近年来,由于统计方法在自然语言处理领域得到广泛运用,大规模语料库的作用得以凸显。其中,大规模的双语对齐语料库因为包含有两种不同......
基于语料库的统计翻译中语料库的粒度可分为词、句和语块几种,目前词对齐和句子对齐的双语语料库已经颇具规模,相关的对齐算法也比......
对齐的双语语料库能够为许多的自然语言应用提供重要的基础,其中,对于许多基于双语语料库的应用来说,双语语料库必须做到词汇级别的对......
双语对齐是当前机器翻译中的一个重要研究课题,对于自然语言处理的一些其它任务,例如双语词典构建、词义消歧等也有很多的应用。双语......
该文探讨了汉语与维吾尔语原始语料处理中切分句子与对齐句子的难点及解决方案,提出了一种用于汉维平行语料库对齐的混合方法及回......
摘要:在自然语言处理的研究和开发中,双语平行语料库的作用日益突显出来,平行语料库的建设对于机器翻译、双语词典编纂、词义消歧和跨......
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生......
阐述了汉文-维吾尔文双语对齐语料库构建的一些技巧,通过实践提出了建设汉文-维吾尔文双语对齐语料库的方法.语料库收集汉文-维吾......
双语语料库的自动对齐已成为机器翻泽研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根......
为提高汉维句子对齐方法的准确率,提出一种分段句子对齐方法。采用词汇信息和长度信息相结合的策略,识别出能作为锚点的一对句子(锚......
自动对齐的目的是将半结构化的注疏文献转化为结构化形式,从而为先秦文献的信息处理提供可靠的帮助。探讨《左传》及其注疏文献的......
本文提出了一种基于词性的判别函数,用来自动识别e句子对齐结果的正确性.通过反向采用基于长度的对齐算法,纠正了初步对齐产生的连......
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全......
双语平行语料库在自然语言处理领域有很多重要应用,但是大规模双语平行语料库的自动获取并不容易。该文提出了一种有效的从Web上获......
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双......
注疏文献中蕴含着丰富的知识,并且它们的行文方式具有半结构化特征。研究了经典古籍与其注疏文献句子对齐的方法,以及注疏文献中注......
随着东盟与中国的经贸日益增加,语言作为两个国家交流的重要渠道,通过人工智能来解决双语问题,也正成为一门重要的研究。双语平行......
双语语料库建设及其自动对齐研究对计算语言学的发展具有重要意义。双语对齐技术是加工双语文本的核心,对齐效果的好坏直接影响了......
本文提出了一种用于汉英平行语料库对齐的扩展方法.该扩展方法以基于长度的统计对齐方法为主,然后根据双语词典引入了词汇信息,而......
随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对......
双语句子对齐在双语语料库的处理中有着非常重要的地位,是构建双语词典的第一步工作。该文利用基于带权二部图的最大权重匹配模型为......
双语术语词典在生物医学跨语言检索系统中有着非常重要的地位,而双语句子对齐是构建双语词典的第一步工作。为了构想面向生物医学......
该文提出了一种从维基百科的可比语料中抽取对齐句子的方法。在获取了维基百科中英文数据库备份并进行一定处理后,重构成本地维基......
维吾尔语新闻网页与对应的中文翻译网页在内容上往往并非完全可比,主要表现为双语句子序列的错位甚至部分句子缺失,这给维汉句子对......
双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点......
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性......
阐述了汉文-维吾尔文双语对齐语料库构建的一些技巧,通过实践提出了建设汉文-维吾尔文双语对齐语料库的方法.语料库收集汉文-维吾......
在自然语言处理的研究和开发中,双语平行语料库的作用日益突显出来,平行语料库的建设对于机器翻译、双语词典编纂、词义消歧和跨语言......
基于实例的机器翻译系统需要双语句对的支持。为大量获取双语句对,则需要以篇章对齐的双语文本为输入,实现句子的自动对齐。通过分......
基于句子的相似性,提出了无指导的汉语句法结构推导方法.基本思想是:首先,在汉语句子库的基础上.通过句对之间的对齐,得到交替的相同片断......