论文部分内容阅读
当用户在输入搜索内容,并在转瞬间得到想要的搜索结果时,他也许不会知道谷歌的系统在后台都做了哪些工作,更不会知道这些关于搜索的工作也在不断发生变化。
负责搜索质量评估和移动搜索的谷歌工程总监斯科特·霍夫曼在搜索领域已经有超过15年的经验。在接受《中国计算机报》记者越洋视频采访时,他详细介绍了谷歌在搜索方面进行的各项改进。“十年前,我们搜索某一信息得到的结果看起来和今天完全不一样。以前,搜索结果只是些网页链接,没有更丰富的内容,而今天我们得到的搜索结果的内容非常丰富,包括网页链接,以及相应的图片、视频、地图等各种各样的内容。除了内容更加丰富外,用户还可以直接搜索到问题的答案。比如搜索‘北京天气’或某个航班号,谷歌可直接给出用户所需的答案,而不是链接到一系列无关的网页。此外,在用户体验方面,谷歌搜索的变化更大。”他表示,谷歌会不停地对搜索引擎进行改进,以便让用户获得更合理的搜索排名结果。
在搜索流程的诸多环节中,如何对搜索到的结果进行排序,是提升搜索质量的关键。对此,斯科特·霍夫曼表示,谷歌用几百个指标衡量搜索结果并对其进行排序,目的是为用户呈现相关度最高和质量最高的搜索结果和文件。这些指标包括关键词在文件中出现的频率及出现的地方等。例如,如果关键词出现在标题中就比它出现在文章的第十行或更靠后的地方更重要。此外,谷歌还会考虑用户的情况,比如用户输入“纽约”,而他的位置又位于纽约,谷歌就不会提供“纽”和“约”分开的搜索结果。另外,其他网页对这份文件的重视程度也是一个衡量的指标,比如文件被引用的程度和频率,被引用得越多就表示这个网页的质量越高或者越重要,这个网页的排名也就越靠前。
针对不同关键词,排名需要考虑的指标还有很多。比如用户在搜索医学类问题时,最重视的肯定是网页的权威性,而不希望看到一个博客里谈到这种疾病;北京的用户搜索餐馆,上海的餐馆信息对他就没有什么价值;用户在搜索“奥运会”一词时,大多是想得到与即将召开的伦敦奥运会相关的信息。
除了根据多种多样的指标对搜索结果进行排序,谷歌对排名的方法进行动态实时的更新和改进。“我们首先会对大家提出的各种新构思进行必要性评估,然后对其中的一部分进行小规模试验。如果的确能给用户带来更好的搜索结果,就会进行下一阶段的实时在线试验。”斯科特·霍夫曼介绍说,谷歌会随机选取一些用户进行试验,如果你经常使用谷歌搜索引擎,可能你已经在不知不觉中参与了在线实时试验。据悉,2011年谷歌共做了5万多次这种试验,并且对搜索引擎进行了超过500项改进。
负责搜索质量评估和移动搜索的谷歌工程总监斯科特·霍夫曼在搜索领域已经有超过15年的经验。在接受《中国计算机报》记者越洋视频采访时,他详细介绍了谷歌在搜索方面进行的各项改进。“十年前,我们搜索某一信息得到的结果看起来和今天完全不一样。以前,搜索结果只是些网页链接,没有更丰富的内容,而今天我们得到的搜索结果的内容非常丰富,包括网页链接,以及相应的图片、视频、地图等各种各样的内容。除了内容更加丰富外,用户还可以直接搜索到问题的答案。比如搜索‘北京天气’或某个航班号,谷歌可直接给出用户所需的答案,而不是链接到一系列无关的网页。此外,在用户体验方面,谷歌搜索的变化更大。”他表示,谷歌会不停地对搜索引擎进行改进,以便让用户获得更合理的搜索排名结果。
在搜索流程的诸多环节中,如何对搜索到的结果进行排序,是提升搜索质量的关键。对此,斯科特·霍夫曼表示,谷歌用几百个指标衡量搜索结果并对其进行排序,目的是为用户呈现相关度最高和质量最高的搜索结果和文件。这些指标包括关键词在文件中出现的频率及出现的地方等。例如,如果关键词出现在标题中就比它出现在文章的第十行或更靠后的地方更重要。此外,谷歌还会考虑用户的情况,比如用户输入“纽约”,而他的位置又位于纽约,谷歌就不会提供“纽”和“约”分开的搜索结果。另外,其他网页对这份文件的重视程度也是一个衡量的指标,比如文件被引用的程度和频率,被引用得越多就表示这个网页的质量越高或者越重要,这个网页的排名也就越靠前。
针对不同关键词,排名需要考虑的指标还有很多。比如用户在搜索医学类问题时,最重视的肯定是网页的权威性,而不希望看到一个博客里谈到这种疾病;北京的用户搜索餐馆,上海的餐馆信息对他就没有什么价值;用户在搜索“奥运会”一词时,大多是想得到与即将召开的伦敦奥运会相关的信息。
除了根据多种多样的指标对搜索结果进行排序,谷歌对排名的方法进行动态实时的更新和改进。“我们首先会对大家提出的各种新构思进行必要性评估,然后对其中的一部分进行小规模试验。如果的确能给用户带来更好的搜索结果,就会进行下一阶段的实时在线试验。”斯科特·霍夫曼介绍说,谷歌会随机选取一些用户进行试验,如果你经常使用谷歌搜索引擎,可能你已经在不知不觉中参与了在线实时试验。据悉,2011年谷歌共做了5万多次这种试验,并且对搜索引擎进行了超过500项改进。