文本对齐相关论文
根据机器翻译的现状和实际需求,文中提出了一种基于E-Chunk的机器翻译模型.E-Chunk形式上是一个无翻译歧义的单词或单词串.基于E-C......
该文的工作紧紧围绕E-Chunk的获取与应用展开,构成一个完整的体系.在E-Chunk概念基础上,作者研究了单语Chunk获取、文本对齐、E-Ch......
在自然语言处理的诸多领域的研究中,双语语料库的重要作用逐渐显现出来。在不同的应用中,需要不同粒度的双语对齐的语料库和相应的双......
针对抄袭检测系统的文本对齐模块无法处理大规模数据的问题,提出基于图论的片断合并算法,通过寻找图的连通分支实现了片段合并的优......
本文提出了基于结构标识的法律文献层次结构模型,该模型描述了汉英法律文献的层次结构特征及章、条、子条的连续性和对应性.根据该......
化工类英汉双语平行语料库的建设具有一定技巧性,掌握基础计算机知识并通过实践能迅速掌握其建设方法。化工类英汉双语平行语料库......
针对生物术语的缩写词识别问题,提出了一种基于逆序文本对齐的搜索算法,它实现简单,不需要大量训练数据。该算法在对Medstract标准语......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
随着信息社会的进步,特别是国际互连网的迅速普及,信息的数量、内容、格式、存在方式与传输途径都发生了很大变化,提高网络信息的查询......
本文报告作者从网上获取香港法律英汉双语文本,利用法律文本的原有体系结构和编号机制进行子段级文本对齐,并将对齐结果进行XML标......
“中国政府西藏白皮书”汉英平行语料库是以迄今为止中国政府发布的12部涉藏白皮书的汉英文本为语料构建的平行语料库,主要为西藏各......
英汉平行语料库的建设具有一定技巧性,掌握基础计算机知识并通过实践能迅速掌握其建设方法。平行语料库运用十分广泛,对外语教学和......