同声传译:翻译软件能否替代人?

来源 :科技生活 | 被引量 : 0次 | 上传用户:xiaowen51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  模仿声音无法做到以假乱真,应该只能做到七分像,因为模仿只能把一个人的习惯在单调水平上重现。
  10月25日,微软首席研究官、微软研究院院长里克·雷斯特博士在天津举办的“21世纪计算大会”中展示的微软最新的研究成果——同声传译,向世人描绘了一幅“跨越语言,沟通无碍”的美好蓝图。
  吸引眼球的同声传译
  在美国热播了40年的科幻电视剧《星际迷航》中,有一个非常“打眼”的工具——宇宙翻译器。星际舰队成员把它别在胸前徽章里,整个星际联邦都广泛使用它将所有的已知语言翻译为听者所懂的语言,对其余的未知语言也可通过对简短几句话的分析而进行转换。按照剧中设定,宇宙翻译器要到22世纪才能发明。
  不过,在雷斯特的设想中,这种翻译器的出现可能不用等那么久,他日前展示的“同声传译”就是通往宇宙翻译器的重要一环。
  在这个10分钟左右的演示中,雷斯特一直中速讲英文,他背后有两个大屏幕。现场观众都看到其中一个屏幕把他讲的话以英文文本的形式展示出来,速度大概只比他的声音慢小半秒。
  在另一个屏幕上,上半部把英文文本中的单词提取出来,并对应中文单词,而下半部按照中文语序已经排列成中文句子。
  随后,最令人激动的时刻到来了,翻译完的中文句子以普通话的形式“说”了出来,声音听起来与雷斯特本人很像,速度基本上是他一说完英语,机器就“说”出仿真声音的中文翻译,听起来就像雷斯特在给自己做同声传译。
  他表示,微软的同声传译不仅能英译汉,还能翻译西班牙语等26种语言。虽然目前还没有走出实验室,未来却可能做成同声传译器,以至有人惊呼学同声传译的人岂不是要失业么?
  语言识别离完美还有多远
  这个吸引眼球的演示第一步就是用计算机识别雷斯特的英文发言,但是这可能也是最难的一步。
  雷斯特介绍,最开始的语言识别采用简单的模式匹配,计算机检查语音产生的波形,并尽量与已知相关的特定单词相匹配。不过这一方法失效率太高了。
  直到七八十年代,隐式马尔科夫模型(HMM)被广泛应用,它利用来自多个人的培训数据建立更为稳健的统计语音模型,成为语言识别的主流。
  “不过,直到今日,即使是最佳的语音系统,在任意语音上的单词出错率还高达20%~25%。”雷斯特说。
  “两年前,我们和多伦多大学的研究人员使用一项名为深度神经网络的技术,仿照人脑行为,语音的错误率比之前的方法降低30%。这意味着之前四五个单词中就会出现一个错误,而现在七八个单词中才会出现一个错误。”
  虽然技术细节仍未透露,不过中科院声学研究所语言声学重点实验室副主任潘接林表示,这一技术还是建立在HMM的框架上,改为用神经网络模拟语音特征分布,从八九十年代就有应用。
  只是现在计算能力提高,能把模型做得更细,也就更“深度”。
  这种方法的准确率与数据积累有很大关系。清华大学计算机系教授黄连生告诉记者,计算机越来越多地学习、掌握更多数据,就会更聪明,这就是“机器学习”,不过机器学习依然有限度。
  对此,潘接林也表示认同,“如果是针对专人的优化‘学习’,语言识别的性能会提高得多一些”。
  机器翻译能代替人工翻译?
  说话人的语言被识别了,如何英译汉也是个大问题。数据显示,近几十年来,因机器翻译质量存在问题,一直无法成为翻译的主流。我们经常会使用软件翻译页面,所得文本之凌乱不言而喻。
  雷斯特表示,他的演示中英译汉需要两个步骤。“第一步是提取我说的单词,然后找到相应的中文,虽然这并不简单,但确实是比较简单的一步。第二步是重新调整单词的顺序,使之符合中文习惯,这是语音正确翻译的重要一步”。
  哈尔滨工业大学机器智能与翻译研究室曹海龙研究员介绍,雷斯特所说的步骤与目前机器翻译的方法是一致的。难点就在于译文选择和调序,不同语言语序不同,一个词翻译成另一种语言也可能有多个候选译文,所以机器翻译结果有时漏洞百出。现有提高正确率的方法需要依靠统计学。
  雷斯特也承认,微软的同声传译在文本方面还有很多错误,而且翻译结果可能很搞笑。不过,他表示,统计技术和大数据的引入将使文本翻译有翻天覆地的变化。
  然而,黄连生并不这么乐观。他认为,机器翻译只能在某个特定领域达到较高的准确率,比如法律或经济领域能达到80%到90%的准确率,这是因为在特定领域词义有了明确界定。而在通用领域,机译准确率不会很高,还是要依赖人工翻译的经验。
  模仿的声音有多像?
  “数年后我希望打破人与人之间的语言障碍” ,当雷斯特用英语说出这句话的一秒钟后,微软同声翻译机模仿他的声音用中文说出。台下的观众报以热烈的掌声。
  确实,如果能在翻译中保留说话人的语调,交流将会更顺畅。雷斯特也表示,他这个不会说中文的人以自己的声音“说”出中文实在令人兴奋。
  他介绍,要达到这一效果,需要一个文本到语音的系统,包含数小时中国人说话的语音。
  此外,他还要预先录制1小时的英文语音数据用来提取自己的声音属性,最后得到仿佛自己在说中文的效果。
  潘接林表示,这是一个个性化语音合成技术。一般情况下,机器通常只需模仿固定的男女两种声音,而要得到针对专人的仿声,则需要获得他/她的语音数据,提取发声相关的特征参数,比如节奏、频率、语气,也就是专业术语说的基频等等。当合成系统适应后,就可以输出仿真声音了。
  不过,黄连生认为,模仿声音无法做到以假乱真,应该只能做到七分像,因为模仿只能把一个人的习惯在单调水平上重现。比如,可以通过一个人走路的习惯,步长、左右摇晃等准确模仿他的行走。但是人讲话的信息量太大,虽然理论上可以分析节奏、频率,但是要完全量化技术上还是做不到。
其他文献
成年人体内摄入的塑化剂可以在12至24小时内有一半及其代谢物会随尿液排出体外,而大部分的塑化剂及其代谢物在24至48小时内由尿液或粪便排出。  塑化剂并不是一个陌生的名字,去年上半年的台湾“塑化剂风波”曾轰动全球,当时受牵连的问题企业有几百家,影响到的产品有近千种。那么,这次白酒当中被检测出塑化剂,问题源头在哪?我们又该如何看待?  11月18日,某财经网站以《致命危机:酒鬼酒塑化剂超标260%》
期刊
研究人员发现,在细胞的表面,有一个特别的蛋白质在与乙肝病毒表面的一个特定区域互动、发生作用。  虽然早在40多年前,人类就发现了乙肝病毒(HBV),但一直以来,科学家们很难了解乙肝病毒的感染究竟是如何发生的。  这是因为,在乙肝病毒入侵宿主、实现感染的过程中,它必须首先与相关细胞表面的一种特定蛋白质结合,这一特定的蛋白质被称为“受体”。然而,乙肝病毒的“受体”是什么,始终是一个未解之谜。  最近,
期刊
最近几年,在华北发生洪涝灾害的概率会越来越大。我们应该做好准备。  近日,国家气候中心最新的气候统计和研究证实,我国华北地区干旱少雨、长江中下游地区洪涝多雨的情况发生了改变,此前“南涝北旱”的局面将转变为“北涝南旱”。  “南涝北旱”向“北涝南旱”转变  2012年,也是北京继2011年之后连续第二年降水量比常年偏多。7月21日,北京市发生暴雨到大暴雨天气,全市平均降水量170毫米,为自1951年
期刊
不管是主读还是被读,二维码对我们生活最大的影响莫过于对于消费习惯的改变。  如果你还在问:“今天你刷(微博)了吗?”那你又OUT了!它早已被另一句问候语所代替:“今天你拍了吗?”不知不觉,二维码已经悄然来到了我们身边。毫无疑问,这是指拍二维码。  到2015年二维码市场规模将超1千亿,腾讯日前加入二维码市场,并喊出了“二维码将是未来移动互联网的主要入口”的口号。而阿里巴巴、新浪、百度、360这些互
期刊
据悉,11月23日,中国航母舰载机歼-15于上午降落在“辽宁舰”甲板上,由飞行员戴明盟首降成功。航空专家、歼-10首席试飞员徐勇凌描述了触舰起飞的重要意义,除了挂拦阻绳和减速过程外,触舰起飞这个过程与正式着舰完全相同。  中船重工701研究所国家航母工程副总设计师吴晓光也公开表示,国人将很快就会看到中国的舰载机在航母上降落或起飞,时间可能在这个月,也可能在今年内。  与此同时,中国首艘航母“辽宁舰
期刊
对于入门级单反,比如佳能350D的自定义功能(C.Fn)“04”就是将快门对焦功能与《*》自动曝光锁互换,彻底将快门与对焦分开。  近日索尼请职业摄影师Gary Heery走上街头,对1012名非专业单反用户进行了一次街头调查,结果非常有趣:约2/3的用户从不或极少使用全自动之外的拍摄模式。1/3的用户承认不知道如何使用单反,其中3/4认为需要上专业课程才能学会使用单反。  这个调查充分说明了单反
期刊
虐待动物事件的根源就在于社会的现状让人与动物的关系出现了问题。而虐待动物的人如果不加以制止,终究会走上欺负弱者的道路,最终引发社会问题。  11月16日,香港,4男1女疯狂虐待一只年约10岁的流浪猫,被香港市民发现。他拍下片段并报警。其后在社交网站,“关注顺天村4男1女虐猫事件”的群组有超过5000名会员关注,更有网友悬赏1万港元,追捕虐猫者。之后,香港警方出动大批警力,前后不到3天,拘捕两名疑犯
期刊
心理学硕士  国家注册心理咨询师  在社会复杂的变化当中,我们看到有的人适应着这种变化,快乐地工作着,而更多的人却因此产生了各种各样的焦虑情绪,还有人甚至由于压力导致形形色色的身心疾病,面对大多数人的困惑和不安,让我们今天了解一下A型性格,也就是平常人所常说的完美性格,完美性格是怎样形成的呢?  A型人格是两位医生弗里德曼和罗斯曼提出的,也是心理学对于身心疾病研究的一个比较重大的贡献,长期以来医学
期刊
《野性之美》  [加]欧内斯特·托马逊·塞顿 著  周达扬 译  大众文艺出版社  [作者简介]  欧内斯特-托马逊-塞顿,著名的博物学家、动物故事作家、画家,被称为动物文学之父。出生于苏格兰,15岁时全家移居加拿大。出版了《野生动物的生活》(四卷)、《温利波戈的狼》等。  [桥段]  迪多(一只母郊狼)超常的智慧给吉姆博特农场的猎狗带来了灾难,也使郊狼逐渐占据了优势。猎狼人杰克在河边的断崖上施放
期刊
大气污染比非典更可怕  问:有些人说,大气污染对人体的伤害比非典还可怕,这是真的吗?  答:PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物。虽然PM2.5只是地球大气成分中含量很少的组分,但它对空气质量和能见度等有重要的影响。PM2.5粒径小,富含大量的有毒、有害物质且在大气中停留时间长、输送距离远,因而对人体健康和大气环境质量的影响更大。  据统计,PM2.5每立方米增
期刊