【摘 要】
:
从双语语料库中提取的机译单元能更好地覆盖真实语言文本,本文提供了一个通过找出两个双语句对之间非全部为高频功能词的"相同和差异"部分,并且利用翻译词典和动态规划算法对
【机 构】
:
中国科学院声学研究所语音交互技术研究中心
论文部分内容阅读
从双语语料库中提取的机译单元能更好地覆盖真实语言文本,本文提供了一个通过找出两个双语句对之间非全部为高频功能词的"相同和差异"部分,并且利用翻译词典和动态规划算法对齐"相同和差异"部分来获取机译单元的算法.对于获取的候选机译单元,本算法设计了三个过滤器来考察其正确性:双语词串相似度过滤考察其语义对应性,词性相似度过滤考察其语法对应性,首尾禁用词过滤考察其搭配正确性.通过抽样检验,最后提取的机译单元的正确率为86%,召回率约为61.34%,该算法对于获取机译单元提供了
其他文献
目的观察胰岛素泵治疗(CSⅡ)对糖尿病患者强化血糖控制的效果。方法将血糖控制差的100例糖尿病患者,随机分为CSⅡ组(60例)和常规胰岛素治疗方法(MSⅡ)组(40例),进行强化胰岛素治疗;以餐
农民工就业难题破解是一个长期过程,不可能一蹴而就。在现实语境下,推进农民工就业需要政府、企业、社会组织以及农民工自己协同作战,四位一体,正确处理好几对关系
本项目是新建工程,新建1套18MW抽凝机组、1套30MW抽凝机组和6MW背压机组。从2004年投入运行到2006年底,本项目已供热119.6万吨,发电84361万千瓦时,生产负荷达到设计能力的90.4%,已达
基于ISO/ IEC 10646和UNICODE国际标准,用传统的字体技术(如TrueType)来实现少数民族文字处理所面临的一个'瓶颈'问题是:'变形显现字符'不存在确定的码位.这
未来10-20年将是我国工业化和城镇化最为重要的时期,这段时期我国将基本完成工业化和城镇化的历史重任,基本实现现代化的宏伟目标。“十二五”时期是完成工业化和城镇化的重要
目的证明耳穴诊断能为急性腹痛提供重要参考价值,证实耳穴与腹腔脏器相对应关系的客观性。方法通过观察腹痛病人100例及健康人体检者30例耳穴反应的变化规律,并进行腹部B超或
应用电子探针分析和角闪石-斜长石温压计,得出闽西南构造带出露于地表不同时期花岗岩的结晶压力分别为早侏罗世花岗岩431.3 MPa、晚侏罗世花岗岩187.2 MPa、早白垩世花岗岩10
我国金融业全面开放后,我国商业银行直面国际金融市场的竞争,要在竞争中求生存,求发展,就必须加快金融创新的步伐。从而快速提高我国商业银行在国际上竞争水平。