基于词语信息度的翻译对应句检索

来源 :外语教学与研究 | 被引量 : 0次 | 上传用户:wokaoyouyaozhuce
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于词汇检索翻译对应句的方法。原文句子与译文句子并不在词汇级存在一一对应的关系,判断是否构成翻译关系也不需要认定所有的词都构成翻译对。本文提出了词语信息度(WI)的概念来反映词在句子中的重要性。词语信息度由词频、词在文档中的分布、词性、词的长度构成。判断是否构成翻译关系时,只关注信息度高的词汇是否构成翻译对。基于高信息度词汇翻译对构建了翻译对应句检索系统。实验表明,系统性能优于简单的基于所有词汇的翻译对应句检索方法,在噪声实验中,与相关研究对比表现了更好的强健性。 This paper presents a method of translating correspondence sentences based on word retrieval. There is not a one-to-one correspondence between the original sentence and the translated sentence at the lexical level, and it is not necessary to determine whether all the words form a translation pair or not. This paper presents the concept of word information (WI) to reflect the importance of words in sentences. Word information degree by the word frequency, word distribution in the document, part of speech, word length form. When deciding whether or not to form a translation relationship, we only focus on whether a highly informative vocabulary constitutes a translation pair. Based on high informational degree vocabularies translation, a translation correspondence sentence retrieval system is constructed. Experiments show that the performance of the system is superior to that of the simple method of translation correspondence search based on all words, which shows better robustness compared with related research in noise experiment.
其他文献
【目的】对中国河西绒山羊、内蒙古绒山羊、辽宁绒山羊和陇东绒山羊4个绒山羊群体KAP131基因的遗传特征进行分析,为揭示绒山羊遗传特征和生产利用提供基础数据。【方法】采用P
超高强铝合金具有很高的强度,同时又具有较强的韧性,是航空航天领域极具应用前景的轻质高强结构材料.作者在查阅大量文献的基础上,结合课题组试制工作,介绍了国内外超高强铝
声纳浮标作为反潜巡逻机的一型重要探潜装备,其使用效果直接影响到反潜巡逻机的对潜攻击效果。论文通过对反潜巡逻机使用多枚声纳浮标对潜定位误差影响因素及其要素解算可行
对客运专线上1座96m跨度的下承式密布横梁体系钢桁-混凝土组合桥进行空间、平面有限元计算分析,并设计制作了比例尺为1-6的全桥模型,分3个阶段进行模型试验,以考察桥梁的位移
作为新一轮工业革命的核心技术,智能制造不仅成为中国制造业变革的核心,而且可被视为我国制造业转型升级的制高点与未来发展方向。智能型制造是制造业数字化、网络化、智能化
《石油浮放设备隔震技术标准》由中国石油天然气集团公司抗震办公室和江苏省地震局主编 ,于 1999年 3月公布 ,1999年 10月开始实施。标准采用以概率理论为基础的二级设防标准
系统分解是模块化设计的关键环节。本文全面介绍了系统分解的步骤,列举了通用要素的提取,非典型要素的标准化处理,分解点的选择,模块层次、数量和规模的确定原则以及接口的处理等
影视史学的概念从诞生到被引入大陆史学界,其含义发生了一定的变化。笔者通过对原始文章的考察,力图纠正在转译中的谬误,还原其本意。此外,本文还在以往研究的基础上,对影视
尽管我国大部分车主还不知道车联网是什么,尽管我国对车联网的技术探索还处于起步阶段,但是,汽车产业链的各个环节已经嗅到商机,汽车厂商、网络运营商、软件服务商、芯片厂商等产
报纸
本文利用方志、明清实录、徽州文书以及家谱中的有关史料对明清徽州社会的灾害概况进行了梳理,对当地所见的十余种灾害从危害形式、易发季节、灾害原因、当地的应对措施等方