论文部分内容阅读
正确率为87%的谷歌翻译,你见过吗?
“松下问童子”该怎么翻译成英文?一位网友将这句话输入了谷歌翻译,跳出来的回答是“Panasonic asked the boy”。这样令人哭笑不得的神翻译,相信你在使用谷歌翻译、百度翻译等人工智能翻译服务的时候也碰到过吧?
虽然机器翻译经常被吐槽不够准确,科学家们对人工智能技术的研究可是一点也没松懈。2016年9月28日,谷歌正式推出神经网络机器翻译系统(Google Neural Machine Translation,简称GNMT),采用最先进的神经网络机器翻译技术,将翻译准确率提高到了87%。这样的科技进步,我们还是要好好鼓掌一下的!
除了谷歌、百度、科大讯飞等专门设有研究语音识别和自然语言处理的机构,其他领域的机构也纷纷开始将语音识别运用到实践中。汇丰银行(HSBC)发起的一项通过语音生物识别(Voice Biometrics)技术对用户账户进行安全保障的研究,研究的基础正是因为我们每一个人的声音和我们的指纹一样都具有特殊性。我们的言语,可以作为我们的身份识别标志,因此,未来的生活、工作、储蓄可能都可以通过声音特征来启动。
然而,当我们为人工智能的又一次突破欢欣鼓舞,感叹人类智慧的发展,期待人工智能大幅度改善人类未来的同时,一些语言学家开始预测,互联网、计算机、手机等电子化工具的使用不仅会带来新词语,也会改变人类语言。
就在谷歌推出GNMT后的第二天,英国《每日邮报》的一则新闻引起了不少人的注意。报道称,随着科技不断进步,声音识别将成为我们与机器互动的主要方式之一。但是,正是由于未来人机互动会成为人们生活、工作的主导方式,科技的进步将会导致人类语言的改变。社会语言学家Watt教授预测,在2066年,各国语言中的部分发音将会逐渐减少甚至被取代,例如英文中的齿间音“th”将会被“f”“d”或者“v”取代, 也就是说,“mother”会变成 “muvver”, “thick”可能会变成 “fick”,当我们想表达“what do you think of this”时,我们说的是“what do you fink of dis”。
事实上,电子化工具对人类语言的改变早就引起了语言学家的关注,“OMG”已经出现在了牛津词典里,去年,“LOL”也正式进入了牛津词典,表情符号的使用在人类沟通中已经不可或缺。就在不久前,微信里还流行过一个“24小时不使用表情符号”的活动。然而,在5000多名参与者中,超过30%的人失败了,23万字的报告被戏称为“血泪报告”。大家纷纷表示:“太难了!”“习惯太难改变了!”“不使用表情使我经常在对话中感到尴尬。”
这是科技发展对我们人类书写习惯的一次冲击,但是语言学家们依然信心满满,他们认为,只有超过十年时间长度的考验,才能决定这些表情符号、特殊表达能否最终进入我们的语言系统。“OMG”在1917年就第一次出现在了报纸上,但是直到最近才出现在牛津词典里。
第二次冲击,无疑就是人机互动、语音识别技术可能带来的对人类发音习惯的改变。声音识别是我们与机器互动的主要方式之一,然而语音识别技术的局限性导致机器只能识别某几类发音,例如机器无法识别齿间音“th”,但是对“f”和“v”这样的唇齿音却有着良好的识别机制,所以,机器语音识别逆向影响了人类的发音方式。千百年来,语言的发展、变化、消亡、借用本身就是自然而然的发展过程,而现在,最新一代的改变,要由机器来触发了。
如果真的发生了这样的改变,对我们语言系统的影响是积极的还是消极的呢?现阶段语音识别中,最困难的不是对个别语音的识别,而是对自然语言中节奏、韵律的识别,以及当一个句子的节奏和韵律有着微弱的区别导致意义完全不同时的识别。比如,“我看见她很高兴”,停顿在“她”后面和“她”前面,两句话的意义就完全不同。当“你大爷”的“爷”字分别轻读和重读时,意义也完全不同。每个人都有着自己说话时的抑扬顿挫、轻重缓急、情绪变化不同表现,这些都是机器难以攻克的难题。即便聪慧如Siri,在说话时,依然有着明显的“机器口音”,不可避免地“一字一顿”,就像是我们坐公交车时听到的语音报站“下、一、站、北、京、大、学、东、门”。如果节奏和韵律是机器难以识别的部分,那人类是不是要改变说话方式,抹去语言中的情绪和抑扬顿挫来适应机器的识别机制呢?以后我们说话会不会也变成“你、好、我、叫、王、小、虎”吗?
所幸,这样的改变并不会发生。世界上所有的语言系统都有着自己的稳定性,人工智能的发展可能会带来语音层面上的部分改变,而这样的改变可能即便不由人工智能的发展也会随着人口大规模迁移、不同国家人口流动而逐渐发生改变,单词发音结构可能会简化,“th”可能会被“d”代替,甚至单词会变得更短,“thanks”变成“danks”。但是,语言中稳定的部分,如语音系统、韵律结构、语义结构、句法系统并不会由此而发生改变。
语言作为人类进行沟通和交流的符号,履行着符号需要完成的功能——充分地表达、传递人类思维和感情。符号的简化(如汉字繁体字向简体字的转变)可以发生,但是符号的功能并不会被简化。科技会改变人类的语言,但是不会改变人类的思维和情感。
“松下问童子”该怎么翻译成英文?一位网友将这句话输入了谷歌翻译,跳出来的回答是“Panasonic asked the boy”。这样令人哭笑不得的神翻译,相信你在使用谷歌翻译、百度翻译等人工智能翻译服务的时候也碰到过吧?
虽然机器翻译经常被吐槽不够准确,科学家们对人工智能技术的研究可是一点也没松懈。2016年9月28日,谷歌正式推出神经网络机器翻译系统(Google Neural Machine Translation,简称GNMT),采用最先进的神经网络机器翻译技术,将翻译准确率提高到了87%。这样的科技进步,我们还是要好好鼓掌一下的!
除了谷歌、百度、科大讯飞等专门设有研究语音识别和自然语言处理的机构,其他领域的机构也纷纷开始将语音识别运用到实践中。汇丰银行(HSBC)发起的一项通过语音生物识别(Voice Biometrics)技术对用户账户进行安全保障的研究,研究的基础正是因为我们每一个人的声音和我们的指纹一样都具有特殊性。我们的言语,可以作为我们的身份识别标志,因此,未来的生活、工作、储蓄可能都可以通过声音特征来启动。
然而,当我们为人工智能的又一次突破欢欣鼓舞,感叹人类智慧的发展,期待人工智能大幅度改善人类未来的同时,一些语言学家开始预测,互联网、计算机、手机等电子化工具的使用不仅会带来新词语,也会改变人类语言。
就在谷歌推出GNMT后的第二天,英国《每日邮报》的一则新闻引起了不少人的注意。报道称,随着科技不断进步,声音识别将成为我们与机器互动的主要方式之一。但是,正是由于未来人机互动会成为人们生活、工作的主导方式,科技的进步将会导致人类语言的改变。社会语言学家Watt教授预测,在2066年,各国语言中的部分发音将会逐渐减少甚至被取代,例如英文中的齿间音“th”将会被“f”“d”或者“v”取代, 也就是说,“mother”会变成 “muvver”, “thick”可能会变成 “fick”,当我们想表达“what do you think of this”时,我们说的是“what do you fink of dis”。
事实上,电子化工具对人类语言的改变早就引起了语言学家的关注,“OMG”已经出现在了牛津词典里,去年,“LOL”也正式进入了牛津词典,表情符号的使用在人类沟通中已经不可或缺。就在不久前,微信里还流行过一个“24小时不使用表情符号”的活动。然而,在5000多名参与者中,超过30%的人失败了,23万字的报告被戏称为“血泪报告”。大家纷纷表示:“太难了!”“习惯太难改变了!”“不使用表情使我经常在对话中感到尴尬。”
这是科技发展对我们人类书写习惯的一次冲击,但是语言学家们依然信心满满,他们认为,只有超过十年时间长度的考验,才能决定这些表情符号、特殊表达能否最终进入我们的语言系统。“OMG”在1917年就第一次出现在了报纸上,但是直到最近才出现在牛津词典里。
第二次冲击,无疑就是人机互动、语音识别技术可能带来的对人类发音习惯的改变。声音识别是我们与机器互动的主要方式之一,然而语音识别技术的局限性导致机器只能识别某几类发音,例如机器无法识别齿间音“th”,但是对“f”和“v”这样的唇齿音却有着良好的识别机制,所以,机器语音识别逆向影响了人类的发音方式。千百年来,语言的发展、变化、消亡、借用本身就是自然而然的发展过程,而现在,最新一代的改变,要由机器来触发了。
如果真的发生了这样的改变,对我们语言系统的影响是积极的还是消极的呢?现阶段语音识别中,最困难的不是对个别语音的识别,而是对自然语言中节奏、韵律的识别,以及当一个句子的节奏和韵律有着微弱的区别导致意义完全不同时的识别。比如,“我看见她很高兴”,停顿在“她”后面和“她”前面,两句话的意义就完全不同。当“你大爷”的“爷”字分别轻读和重读时,意义也完全不同。每个人都有着自己说话时的抑扬顿挫、轻重缓急、情绪变化不同表现,这些都是机器难以攻克的难题。即便聪慧如Siri,在说话时,依然有着明显的“机器口音”,不可避免地“一字一顿”,就像是我们坐公交车时听到的语音报站“下、一、站、北、京、大、学、东、门”。如果节奏和韵律是机器难以识别的部分,那人类是不是要改变说话方式,抹去语言中的情绪和抑扬顿挫来适应机器的识别机制呢?以后我们说话会不会也变成“你、好、我、叫、王、小、虎”吗?
所幸,这样的改变并不会发生。世界上所有的语言系统都有着自己的稳定性,人工智能的发展可能会带来语音层面上的部分改变,而这样的改变可能即便不由人工智能的发展也会随着人口大规模迁移、不同国家人口流动而逐渐发生改变,单词发音结构可能会简化,“th”可能会被“d”代替,甚至单词会变得更短,“thanks”变成“danks”。但是,语言中稳定的部分,如语音系统、韵律结构、语义结构、句法系统并不会由此而发生改变。
语言作为人类进行沟通和交流的符号,履行着符号需要完成的功能——充分地表达、传递人类思维和感情。符号的简化(如汉字繁体字向简体字的转变)可以发生,但是符号的功能并不会被简化。科技会改变人类的语言,但是不会改变人类的思维和情感。