新型语音服务浮出水面

来源 :互联网世界 | 被引量 : 0次 | 上传用户:haley912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  
  梦想成真
  如果你想要在上下班的路上上网冲浪,已不需要去买一款更加强劲的手机,只要用你自已那甜美的嗓音就能办到了。这是因为一种新的语音服务正在全球浮出水面。用户只要拔打一个免费的电话,然后通过语音命令就能收听到各种信息:从天气预报到股票行情;从飞机航班到各种新闻故事。
  提供此类服务的公司有:Audiopoint、BeVocal、Quack.com、TellMe和TelSurf网络公司,它们有的正在测试它们的系统,有的已经开始提供服务。而且还会有更多的公司诞生。如果他们成功的话,将会改变我们传统意义中的电话的概念,会把电话变成一种交互性的收音机。
  所有这些正在发生的一切,是基于两项关键技术的成熟。即,语音识别技术和像VoiceXML这样的编程语言。来自于Lucent、Nuance和SpeechWords等公司的语音识别软件能够听懂各种各样的口音和语调,而且不需要事先对某人的声音进行特别训练(目前中国市场上的中文语音输入软件都是需要事先进行声音训练的)。然而使用像VoiceXML这样的编程语言能够很容易的编写出声音服务“网页”,就像用HTML编写普通网页一样方便。
  通过VoiceXML人类的语音可以成为鼠标的替代品,可以用你的一条语音命令来代替单击一下鼠标。这并不是用语音命令调出传统网页,而是用声音表达的文字、数字、音乐等专门为电话而编撰的内容。
  
  门户大战
  可以预见,语音门户的大战将给用户带来各种全新的服务。BeVocal将提供驾驶向导;TelSurf将能让用户收听和发送e-mail;TellMe将允许用户免费打2分钟的美国国内电话。自从TellMe提供免费服务后,其它公司也纷纷提出了免费服务。
  当然这是有风险的。其中TellMe的风险结构尤为突出,它是由来自网景和微软的顶级工程师创立的。该公司预期需要投入5300万美元资本——而这仅仅是根据硅谷的一般标准来算的。公司已得到了3家风险投资公司的支持。
  TellMe的目标不仅仅是基于电话的信息服务,而是v-commerce(声音商务,相对于电子商务而言),他们希望其他公司使用他们的技术在互联网上建立一个“声音表达”(相对于传统网页而言的另一种信息表达方式),就如同他们自己建立的网络服务一样。用户能够很容易地搜到一本书,然后说一声“买”就能轻而易举的买下它,过不了多久就会送到你的家里。
  当然这些服务还必须解决一些技术上的问题。TellMe对1500多名用户的语音命令的反应速度显得非常快,但对数百万用户的反应会很慢。而且在同一通信线路上,系统能很好的理解每一个词语,但对信号传输比较差的电话,用户必须多次重复说过的话。
  基本上,TellMe和它的竞争伙伴们必须让用户相信他们确实需要这样的服务。他们提供的大部分信息通过网页、收音机、手机显示屏已经能够获得。最具吸引力的服务也许应该是一种声音与文字相结合的聪明方式,比如:通过语音询问一个地址,然后从手机显示屏上得到驾驶指示。
  无论如何,这些服务最终都要找到一个赚钱的方式。TellMe选择了一个广告支持的商业模式,但也打算为电子商务网站建立和维护声音服务系统,并从每一笔通过它的系统完成的交易中提成。
  声音门户可以很好的成为一种新的汽车收音机的交互形式。乘车上下班的人可以选择他们的新闻、回答他们的e-mail或者选购家庭日用品。这只是幻想吗?最近福特汽车和Lernout&Hauspie —— 一个语音产品公司——达成风险投资正是要涉足这一领域。
其他文献
10月29-30日,德国英飞凌科技公司(Infineon)在北京举行了2003年中国首届英飞凌汽车电子技术研讨会,汽车行业专家、学者、专业技术人士等汇聚一堂.主讲人英飞凌的Alfons Graf
一、操作系统采用的安全控制  操作系统采用的安全控制主要包括两方面:访问控制,隔离控制;其中访问控制是安全控制的核心。  1.访问控制  在身份识别的基础上,根据身份对提出资源访问的请求加以控制。它基于对主体(及主体所属的主体组)的识别,来限制他(他们)对客体的访问,还要校验主体对客体的访问请求是否符合访问控制的规定,从而决定对客体访问执行与否。访问控制的基础是主客体的安全属性。  访问控制主要包
据市场调查公司今年5月公布的年度调查报告结果显示,目前我国IC设计产业正以30%的年均增长率高速增长,预计今年我国集成电路设计公司平均营收将达到268万美元,2004年将上升至