谷歌更懂你

来源 :世界博览 | 被引量 : 0次 | 上传用户:zfh115101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  阿米特·辛格哈尔(Amit Singhal)出生在上世纪70年代的印度,黑白电视剧的《星际迷航》是他最好的玩伴。“我静静地坐着,观看Kirk和Spock与计算机交谈,这副画面在我的脑海中根深蒂固。”
  如今辛格哈尔已经成为谷歌(Google)科学家兼高级副总裁,但童年的记忆成了他一直追求的梦想。对他来说,最激动的可能是拥有一台“星际迷航”式的设备,“无需请求就直接告诉我接下来要做什么、该怎么做。它还可以帮我为孩子的生日做准备——它能感知到什么样的礼物能让孩子开心、知道我在哪买这些礼物最划算——当然它会告诉我怎么去这家商店。”
  梦想照进现实
  作为谷歌搜索引擎的首席科学家,辛格哈尔正在全力以赴朝着他的“星际迷航”进发——实现“智慧搜索”。以搜索“巨无霸汉堡”为例,智慧型的搜索不仅会告诉你巨无霸汉堡包括哪些食材、在哪里买得到,还会告诉你吃这样一个汉堡将带来怎样的影响。它会提供一个营养图表,告诉你这已经超过了每天所需的脂肪摄入量,而不仅是抛出一些冷冰冰的数据。
  有了这样一张表在脑海中,即使不是整天加加减减、计算卡路里的减肥斗士,也会立刻明白,它为什么被称作“垃圾食品”,常吃会对身体有害。看,“智慧搜索”让你一下子成了一个话题的行家。
  实现“智慧搜索” 当然不是一蹴而就,搜索引擎本身智慧的增长也是个循序渐进的过程。只不过,谷歌一直在加速这个过程。
  “十年前,当我刚刚进入Google工作时,我们擅长的是搜索确切的单词和短语。” 辛格哈尔告诉《世界博览》记者。
  “确切”的词和“关键词”是两码事儿。那时候,如果你搜IBM,很可能前两页都是些不知所云的内容。因为搜索引擎甚至根本不明白,你要找其实是“国际商业机器(International Business Machines)”,它只是机械地搜索与“IBM”相匹配的东西而已。而今天,凡是会使用搜索引擎的人,都将“关键词”视为理所当然的事。比如随意找个搜索引擎,在搜索框中键入“中国国旗”,你都会在第一条结果中看到国旗的图片。
  “但是今天的谷歌搜索已经远远超越了关键词索引的阶段,它开始能够理解你的搜索意图。” 辛格哈尔说,这可能是很多用户都没注意到的,里程碑式的变革。这个变革就是对同义词的理解,比如搜索“餐馆”时,谷歌会把诸如“餐馆”、“餐厅”、“饭店”等同类信息一并反馈给你。但这同时又带来了一个挑战,就是现在搜索引擎的热门研发方向——语境搜索。
  尤其是英语中的动词,比如 “改变”一词,就可能有很多不同的含义。“改变”笔记本电脑的亮度是指要“调整”它;“改变”货币则意味着要“兑换”它。反其道而行之的搜索,对语言学习的学生们尤其有用。还拿英语来说,动词词组向来令人头痛,而你只要把核心动词和名词打进去,出来的结果——那个完整的句子,就会告诉你正确的组合。比如,键入“knock(敲)”和“door(门)”,就会看到不止一个结果里有“knock at the door(敲门)”。
  人类对搜索引擎的依赖是有目共睹的,正因如此,正确的信息就尤为重要了。
  超越智能化的智慧
  辛格哈尔也认同,这是个重要而艰巨的任务。“要在数十亿网页、图像、视频、甚至你认识的人和他们与你共享的信息中挑选正确的结果,犹如大海捞针。但这有助于提高‘命中率’。这也是为什么我们要让谷歌不仅能够理解内容,还要能理解人与人之间的关系。”
  所以谷歌展开了社交搜索业务,经过改进的Search plus Your World功能,就将Google 纳入其中。这相当于将微博和人人纳入了搜索之中,从而根据对用户的使用习惯和交际圈的特点,提供个性化地搜索结果,或者说是“定制版搜索”。鉴于这些结果可能包含个人信息,谷歌用SSL来保护这些页面,用Gmail保护和安全等级对个人内容进行加密。“Search plus Your World英文版现已在Google. com上使用,我们正着手将这些功能带到其他国家。”
  “有的放矢”是从横向对搜索引擎做出要求,纵向的时间轴也不可忽视。回忆一下自己有没有过这种经历:明明要找的是“新”闻,却被满眼因点击率高而高悬于首页的“旧”闻,逼得发狂。“去年11月,我们改进了算法,以更好地识别搜索的新鲜度。” 辛格哈尔说,现在你搜索“奥运”,谷歌的新鲜度算法,让你不用再输入2012,直接看到的就是伦敦奥运的新闻。
  尽管谷歌搜索在日新月异地变化着,现在的智慧化成就离辛格哈尔的目标还有很大的差距。“我希望搜索引擎像一个懂我的专家朋友,我可以问它 ‘带有杀虫喷雾剂的蚊帐比不带的蚊帐更有效吗?’,然后它会像一个专家那样告诉我:‘根据这一研究来看,结果是……’” 现在,辛格哈尔正为这个梦想奋斗着。
  重要的是,辛格哈尔理想中的谷歌搜索是全声讯的,搜索的过程就像和一位无所不知的朋友聊天、咨询。而辛格哈尔的同事,也一直在跟进语音搜索。现在,你不仅可以跟你的安卓手机“耳鬓厮磨”,还可以通过麦克风对计算机或笔记本电脑发号施令。
  这一服务刚推出不久,还存在一些诸如音质、降噪等问题,“但用户的反应都还不错,” 谷歌语音搜索研究科学家佩德罗·莫雷诺(Pedro Moreno)对此踌躇满志:“我们的目标是让用户能随时随地使用语音识别技术,只要需要打字,都可以用说话来代替。”
  到时候大街小巷都是些对着自己的谷歌终端喃喃自语的人了,可是老师在课堂上提问的乐趣不就荡然无存了吗?因为话音未落,齐刷刷的答案就跃然眼前——这让需要联网的上机考试怎么好?
   Google搜索背后的数字
  Google通常只需0.25秒便可對搜索请求做出回应
  自2003年到现在,Google搜索已解决4500亿个搜索请求
  用户每天搜索的关键词中,16-20%都是新的
  平均每个Google搜索关键词往返于用户电脑和数据中心的单程距离长达750英里
  Google对搜索结果使用了包括“网页排名”在内的200多种排名指标
  Google的索引库中收录了几十亿个网页,数据存储多达1亿GB
  截止目前,Google在搜索算法开发上投入的时间超过1000人工年
  Google搜索覆盖的语言多达146种
  Google搜索全球范围内拥有181个域名
其他文献
【原题再现】【题目类型】材料作文【题目来源】上海市杨浦区高三年级期中考试作文题有哲人说:“小成靠勤,中成赖智,大成在德,终成于道。”根据上面材料,自选角度,写一篇文章
草木之美,茶水幽香;相聚时短,相思时长;隔代亲,亲又亲;一首诗,寄深情:“总是向你索取,却不曾说谢谢你,直到长大以后,才懂得你的不易……”——编者端一杯菊花茶水,午后在阳台
7年前的春天,当王微在上海体育馆附近的一个小区里租了一套3室1厅的民房,创办他的土豆网时,绝对没有人会想到,王微能走到今天。看看下面的数字,你就知道这是怎样的成就:月独
去年夏天,内华达州通过了一项法律,允许无人驾驶汽车在省道上行驶,进一步为无人驾驶汽车铺平了道路。内华达州州长Brian Sandoval则亲自体验了一程谷歌的无人驾驶汽车,并且形
为了满足学生们的好奇心,丰富学校体育教学内容。笔者在体育教学过程中对气球进行了大胆创新与利用。受到学生们的普遍欢迎,现介绍如下:一、追赶击球练习1.练习目的提高学生
在脑卒中病人中,脑出血占10~20%,其死亡率和致残率均高。急性期除采用常规内科治疗外,近年来微侵袭血肿抽吸术治疗脑出血疗效也得到肯定,但仍有许多病人昏迷时间长,高热和抽搐
现行人教大纲版高中语文教材第一册选编了鲁迅《〈呐喊〉自序》一文,该文是鲁迅十分重要的一篇作品,文章语言朴素、简洁,但内容丰富、思想深邃,给人以强大的感染力。  文章第二自然段开头是这样写的:我有四年多,曾经常常,——几乎是每天,出入于质铺和药店里,年纪可是忘了,总之是药店的柜台和我一样高,质铺的是比我高一倍,我从一倍高的柜台外送上衣服或首饰去,在侮蔑里接了钱,再到一样高的柜台上给我久病的父亲去买药
《周礼》春官中之大宗伯执掌包括天神、地示(祇)以及人鬼三大类重要之祭祀礼仪,其实包含岁时礼俗以及生命礼俗两类活动,前者在于强调岁时礼俗具有循环往复的可逆性,后者则偏
为探讨脑损伤诱导神经细胞凋亡的作用及其机制,应用大鼠液压冲击脑损伤模型,在脑损伤后不同时间段(3h、12h、24h、48h、72h)处死动物,分别应用HE染色、流式细胞仪检测、TUNEL法测