论文部分内容阅读
(记者汤铭)经济的全球化必须克服语言上的障碍,这在客观上使语言技术成为21世纪的发展需求热点。为了能够让更多国家的人更便捷地参加北京2008奥运会,我国正在研发的奥运多语言信息服务系统将领先全球提前服务大众。
“Ich mchte die Teilnahme an den Olympischen Spiele Beijing.”一名德国体育爱好专门者专门打来电话向北京2008奥运会票务中心咨询如何参加奥运会事宜,如果这种情况出现在以前,票务组还得到处寻找懂德语的人来回答这位德国朋友的各种问题,但是如今,不用这么麻烦了。“面向奥运的多语言智能服务系统”能轻松帮他们搞定一切。在国际友人拿起电话开口说话的瞬间,多语言系统就开始自动识别出他的语种,从而自动地切换到该语种的平台上。
这项举措不但方便了国际友人更好地了解北京奥运会以及北京的风土文化,而且北京市民,尤其是北京的商业人士也可以用它来无障碍地与外国友人沟通。这么方便的一个技术到底是如何实现的呢?
通晓11种语言
“首都信息发展公司(简称 首信公司)正在建设中的奥运多语言信息服务系统,目前已经能支持中文和英文,未来还将扩展到法、德、西班牙、阿拉伯、日、韩、俄、意等11种语言。北京将成为世界上第一个大规模向国外游客提供多语言智能信息服务的城市。”作为首都信息发展公司2008奥运多语言服务中心总经理,高佳卿对于解决奥运会期间将可能面临的语言问题显得很有信心。
高佳卿介绍,作为北京2008年奥运会多语言服务供应商,其实早在2007年4月与奥组委签约之前,首信公司就与国内26家合作伙伴一起开始了奥运多语言智能信息服务系统的开发建设工作。
“多语言智能信息服务系统”是一个面向奥运会场馆内外,基于宽带网络支持,以多语言智能信息处理平台和海量数据库为核心,由数以百计固定与移动的多语言服务智能体组成的大规模分布式网络系统。用户可以通过计算机、移动电话、固定电话、信息亭、移动终端等多种方式进行访问和交流。未来在奥运会期间,来自世界各地的游客除了可以通过固定电话和移动终端获得多语言服务外,还可以通过新安装在北京主要街道沿线的信息亭查询赛事、交通、天气、旅游、餐饮等所有与奥运会相关的信息。
2008年奥运会期间,首信将在奥运会比赛场馆内和周边新装550台专门的自助服务信息亭用于多语言信息服务。
高佳卿还透露,在近期举行的“好运北京”系列测试赛中,奥运多语言信息系统也参加了测试,在流畅度、可读度方面都有出色表现。下一个阶段系统开发重点将会围绕在增加内容资源、扩充语料库、提高翻译的准确率和效率、丰富提供服务的手段和渠道上。而在11月份,首信还将推出专门用于多语言信息服务系统的终端设备用于测试。
自主技术成核心
高佳卿介绍,“就技术方面而言,奥运多语言系统主要包括三大模块,第一是在线多语言智能信息处理平台; 第二是一个动态更新的资源库,包含了有关比赛和北京的吃、穿、住、行各方面的信息; 第三是针对用户进入系统获得服务的各种手段的接口。”
记者还了解到,奥运多语言服务系统的核心技术,大都是国内自主研发的,研发机构包括研究所、高校等多家单位。而核心技术本身主要包括: 语音识别、语意机器翻译和语音合成。
奥运多语言服务系统中的语音识别技术,可以自动筛选人话语中的声学特征,把声音信号转化为字节,并以字节的形式把语音数据与语料库中保存的数据相比对,最后通过算法处理优选出与接收到的话语最匹配的意思。这一复杂程序在极短时间内就能得到处理,询问者几秒钟后就能从系统得到回应。
高佳卿表示,三项核心技术中最成熟的当属语音合成。语音合成又称文语转换技术,它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息。并且通过语音合成还可以在任何时候将任意文本转换成具有高自然清晰度的语音。
未来,奥运多语言服务信息系统可以让机器像人一样,能够抑扬顿挫地“开口说话”。而且系统支持的多种角色服务也可满足不同应用中的个性化要求,如赛事信息发布时的活泼语音风格、公共信息服务中比较平稳的语音风格等。
由于该系统在奥运史上首次实现了多语言服务,奥科委己经将“面向奥运的多语言智能信息服务网络系统”项目列为科技奥运十大专项之一,而国家“863”计划和北京市科技计划也分别将其列为重大研究项目。
“Ich mchte die Teilnahme an den Olympischen Spiele Beijing.”一名德国体育爱好专门者专门打来电话向北京2008奥运会票务中心咨询如何参加奥运会事宜,如果这种情况出现在以前,票务组还得到处寻找懂德语的人来回答这位德国朋友的各种问题,但是如今,不用这么麻烦了。“面向奥运的多语言智能服务系统”能轻松帮他们搞定一切。在国际友人拿起电话开口说话的瞬间,多语言系统就开始自动识别出他的语种,从而自动地切换到该语种的平台上。
这项举措不但方便了国际友人更好地了解北京奥运会以及北京的风土文化,而且北京市民,尤其是北京的商业人士也可以用它来无障碍地与外国友人沟通。这么方便的一个技术到底是如何实现的呢?
通晓11种语言
“首都信息发展公司(简称 首信公司)正在建设中的奥运多语言信息服务系统,目前已经能支持中文和英文,未来还将扩展到法、德、西班牙、阿拉伯、日、韩、俄、意等11种语言。北京将成为世界上第一个大规模向国外游客提供多语言智能信息服务的城市。”作为首都信息发展公司2008奥运多语言服务中心总经理,高佳卿对于解决奥运会期间将可能面临的语言问题显得很有信心。
高佳卿介绍,作为北京2008年奥运会多语言服务供应商,其实早在2007年4月与奥组委签约之前,首信公司就与国内26家合作伙伴一起开始了奥运多语言智能信息服务系统的开发建设工作。
“多语言智能信息服务系统”是一个面向奥运会场馆内外,基于宽带网络支持,以多语言智能信息处理平台和海量数据库为核心,由数以百计固定与移动的多语言服务智能体组成的大规模分布式网络系统。用户可以通过计算机、移动电话、固定电话、信息亭、移动终端等多种方式进行访问和交流。未来在奥运会期间,来自世界各地的游客除了可以通过固定电话和移动终端获得多语言服务外,还可以通过新安装在北京主要街道沿线的信息亭查询赛事、交通、天气、旅游、餐饮等所有与奥运会相关的信息。
2008年奥运会期间,首信将在奥运会比赛场馆内和周边新装550台专门的自助服务信息亭用于多语言信息服务。
高佳卿还透露,在近期举行的“好运北京”系列测试赛中,奥运多语言信息系统也参加了测试,在流畅度、可读度方面都有出色表现。下一个阶段系统开发重点将会围绕在增加内容资源、扩充语料库、提高翻译的准确率和效率、丰富提供服务的手段和渠道上。而在11月份,首信还将推出专门用于多语言信息服务系统的终端设备用于测试。
自主技术成核心
高佳卿介绍,“就技术方面而言,奥运多语言系统主要包括三大模块,第一是在线多语言智能信息处理平台; 第二是一个动态更新的资源库,包含了有关比赛和北京的吃、穿、住、行各方面的信息; 第三是针对用户进入系统获得服务的各种手段的接口。”
记者还了解到,奥运多语言服务系统的核心技术,大都是国内自主研发的,研发机构包括研究所、高校等多家单位。而核心技术本身主要包括: 语音识别、语意机器翻译和语音合成。
奥运多语言服务系统中的语音识别技术,可以自动筛选人话语中的声学特征,把声音信号转化为字节,并以字节的形式把语音数据与语料库中保存的数据相比对,最后通过算法处理优选出与接收到的话语最匹配的意思。这一复杂程序在极短时间内就能得到处理,询问者几秒钟后就能从系统得到回应。
高佳卿表示,三项核心技术中最成熟的当属语音合成。语音合成又称文语转换技术,它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息。并且通过语音合成还可以在任何时候将任意文本转换成具有高自然清晰度的语音。
未来,奥运多语言服务信息系统可以让机器像人一样,能够抑扬顿挫地“开口说话”。而且系统支持的多种角色服务也可满足不同应用中的个性化要求,如赛事信息发布时的活泼语音风格、公共信息服务中比较平稳的语音风格等。
由于该系统在奥运史上首次实现了多语言服务,奥科委己经将“面向奥运的多语言智能信息服务网络系统”项目列为科技奥运十大专项之一,而国家“863”计划和北京市科技计划也分别将其列为重大研究项目。