论文部分内容阅读
向计算机询问一个问题,然后就要得到一个合理的答案——很久以来这一直都是科幻片中的情景。而现在互联网领域新兴的语音门户正将这种场景变为现实。
未来语音应用的关键在于语音技术的发展。在过去几年里,ASR引擎的精确度和词汇量已经大大提升。精确的算法、显著增强的处理能力、更低的成本和实现自助沟通、连续语音的更强大技术推动了这些进步。Barging技术也已完善,可使主叫用户根据提示进行应答,并且可识别用户的应答。自然语言功能的推出也对语音应用的用途产生了极大影响。
语音门户(voice portal)——由此延伸出了一个新的时髦名词“vortal”——可借助电话而非键盘、通过语音浏览互联网内容。这种门户是在交互式语音电话系统基础上演进而来的。交互式电话系统通过记录下来的语音菜单,指示您由说话或在按键电话上按一个号码来选择菜单。而理想的语音门户网应能“理解”口头问题,然后搜索互联网页寻找出答案。答案可通过计算机化的语音读出来或通过移动设备的屏幕显示出来。
InfoTalk去年7月份在香港推出了SmartCaller语音门户。用广东话通过电话即能从SmartCaller中获取股票行情、天气预报和体育赛况等消息——即使象大多数香港人那样夹杂一些英语单词也可以。去年年底,总部在香港的Tom.com效仿中国大陆的一家语音门户,也推出了可提供语音邮件、北京酒店预订和普通话国际新闻等服务的Tom Voice语音门户。另外,美国的语音门户Hey Anita最近也在韩国推出了语音业务。
香港的语音识别技术开发商InfoTalk联合创始人和首席执行官Alex Leung说:“虽然亚洲的语音门户市场依然处于‘婴儿期’,但这‘婴儿’却成长得非常快。”
语音门户的倡导者称,语音门户对于亚洲而言是一件非常自然而可行的事情,因为亚洲有些国家的语言用键盘输入非常困难。“对于亚太地区的网络用户而言,语音输入比键盘输入更为自然。”英特尔公司所属的Dialogic分部市场开发总监EamonnKearn说。另外一个因素是该地区广泛接受移动电话,移动电话将成为一种新的上网方式。
但语音门户网能成功运作吗?市场调查公司Gartner在香港的互联网分析师Joe Sweeney称,许多公司仍在力图找到这种技术的最佳利用途径。亚洲和世界上其他地方一样,“许多人在利用语音门户时主要在说而不是听。”他说道。
另外一个缺点就是现在运营的所有语音门户都只能提供互联网类似服务,如经过选择的航班信息或有限的标题新闻,而不是真正的网络浏览。InfoTalk公司的首席执行官Alex Leung宣称,当人们用广东话说“我想查找德国马克和英镑之间的汇率”之后,可迅速通过SmartCaller得到正确答案。其实并非完全如此。REVIEW功能一再出现,说明SmartCaller只能在经过一系列提示响应之后、而且说话时每次只能慢慢地说一个字的情况下,才能得到理想的答案。
现在有一个解决方案就在眼前。香港新兴企业Weniwen技术公司主席Pascale Fung是一位语言学家,同时也是语音门户技术的开拓者之一。Fung称她发明了一套系统,可使计算机掌握完整的一句话的意思。Weniwen的语音浏览器宣称将可通过语音实现真正的网络浏览。Fung的目标是向移动业务运营商销售她的Weniwen的业务。
“我们要让人们自然而然的说话,”Fung说道,“我们需要一套系统,通过该系统我们可与航空公司联系,并说‘我将行李丢在飞机上了,我该怎么办?’,然后便可获得我们所需的信息。”
Sweeney称这一天的到来还需要五年的时间。“但我经常犯这样的错误:很多事情都比我预测的时间发生得更早”他笑着补充说。
语音技术是当前迅猛发展的电子商务经济最重要的“推进器”之一。语音技术市场正在迅速成长,且发展势头良好。分析家预测,从1999年到2004年,语音技术市场将以每年31%的速度持续增长。语音技术市场的迅速扩展意味着我们正面临大量部署语音应用的转折期。