搜索引擎应用性能分析报告

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:lfs888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  搜索引擎改变了人们的生活,不论是办公室白领、在校学生还是科研人员,使用搜索引擎查询信息几乎成为每日必做的一件事情,使用搜索引擎已经成为人们的一项新的生活内容。在搜索引擎出现以前,《十万个为什么》系列丛书给予人们很大的帮助,现在的搜索引擎所包含的信息已经大大超越十万个的级别,以致于人们有个笑谈,现在买个馒头我们都要“谷歌一把”或“百度一下”。
  搜索技术从1997年开始到现在已有超过十年的发展历程。在这十年的时间里,我们注意到整个的互联网发生了翻天覆地的变化。在1997年的时候,全世界只有十万个网站;到了今天,全世界一共有超过1.6亿个网站。1997年的时候,全球只有2600万的URL,到今天已经有超过1万亿个网址,而且每天还在以非常快的速度增长。互联网的内容也越来越丰富多彩,在1997年的时候,全球互联网上大概只有17万亿个字节的内容,现在已经有500万TB这么大的容量。一个TB相当于1000个GB这么大的容量。我还仅仅说的是网页,没有包括电子邮件、音乐、视频,所以,真的是信息爆炸的时代。
  用户会越来越多地依靠搜索引擎帮助他们完善搜索信息、查找内容,甚至帮助他们完成做决定这样一些与生活、与工作密切相关的事情。我们可以从一些数据看到,我国的互联网用户对于搜索引擎越来越依赖,越来越离不开。根据艾瑞咨询最新发布的统计数据我们可以看到,中国网民中有68%的用户都会使用搜索的服务。在过去两年的时间,搜索用户数增长了88%;到今天将近两亿用户都在用搜索工具。使用的频率也非常快地增加。在2007年的時候,平均每个人每个月只有21.5次使用搜索,但是到了现在,每个人每个月平均28次使用搜索。然而,随着用户对搜索使用频率越来越高,对搜索的满意程度却在走下坡路。
  目前,搜索引擎做的很多的事情都是帮助用户在网页上进行导航,来帮助用户寻找信息。可是在0.0001秒的时间里搜出几百万甚至上千万的结果对用户并不意味着合适。用户需要的是0.0001秒的时间找到的信息能够给我帮助,能够在最短的时间里找到我要找的东西。因此,我们希望搜索引擎能够帮助用户用简捷准确的方式发现有用的信息,完成关键的搜索任务,最后做出明确的决策。
  许多人可能认为搜索引擎发展到今天已经足够用了,但我们相信搜索技术到了今天也仅仅是一个开始。如果我们仔细研究一下用户的搜索行为,就会有这样的几个发现:将近50%的搜索结果是不能满足用户的真正需求的,用户不断地调整他们搜索的关键字,甚至最后放弃了搜索。另外,35%的用户觉得很失望,因为他们找到的结果可能跟他们的要求完全不相关。
  此外,我们发现用户在搜索信息的时候通常需要帮助。72%的用户认为现在提供的搜索页面,搜索结果非常零乱,他们要花很多的精力和时间自己去处理结果。所以,我们更需要一个能够帮助人们迅速找到有用信息,并做出决策的搜索引擎。
  可以说,搜索引擎的出现,改变了互联网的格局,同时搜索引擎的巨大市场吸引了许多有实力的公司加入到这一行列中,希望能分得一块蛋糕,目前搜索引擎市场上除了Google、百度、搜狗等之外,微软也推出了替代Live的Bing,搜索引擎行业可以说一片欣欣向荣。
  作为互联网市场的追赶者和挑战者,Bing的推出在微软整体互联网战略中占有重要的地位。Bing中国搜索明晰并强化了其搜索引擎的品牌定位:“快乐搜索,有求必应”。在搜索引擎结果往往不能满足用户需求的背景下,微软Bing结合最新研发成果,致力于为用户提供与众不同、独具创意和组织化的精确搜索的快乐体验,其视频直播、地图搜索、图片搜索、右侧预览等细节功能的展现,体现了其以“用户体验和需求至上”为中心的产品设计理念,将逐步获得网络用户的认可。
  不过微软最近推出的Bing搜索能否在已经很激烈的搜索战场上战胜Google和百度呢?本期中国计算机报IT实验室选择了目前主流的百度、谷歌、搜狗以及Bing四家最新的搜索引擎来进行用户体验对比测试,以帮助读者更好地了解搜索引擎应用现况和发展趋势。
  
  贴近用户的真实评测
  
  目前搜索引擎搜索主要是针对关键字,这类搜索等待的时间几乎可以忽略不计,因此很多人认为搜索引擎的性能是非常良好的。但是随着搜索技术的发展,搜索引擎的应用范围不仅限于关键字的搜索,还包括图片搜索、视频搜索、地图搜索、内容翻页、网页快照等其他应用。以图片搜索为例,bing搜索引擎搜索图片,提供了很多的设置,如图片搜索可选择大小、图片布局(横幅、竖幅、方形),图片样式等,但用户使用了这些设置后,其体验是否良好?如何获得用户体验的准确数据呢?
  作为一种最基础的互联网应用,搜索引擎的各种应用监测是搜索引擎提供商必须重视的。对搜索引擎应用性能的好坏,我们认为主要可以通过以下方面来评价:
  1.图片搜索:为了吸引用户使用搜索引擎,搜索引擎服务提供商在图片搜索方面提供很多设置(高级选择),并且搜索出的图片质量比较高,当用户搜索图片的结果返回时需要在客户端渲染,对于高质量的图片渲染花费的时间比搜索关键字时间要长,因此对图片的搜索的用户体验需要关注,用户对于搜索引擎的要求不同于门户网站。从用户的角度出发,不论搜索的是什么,他们总希望返回结果要快,因此搜索引擎的首屏时间标准要比门户网站高。
  2.地图搜索:搜索引擎地图搜索是用户使用最多的功能之一,当用户搜索一个地址,搜索引擎返回地址搜索的结果。通过对地图监测分析发现,搜索结果返回的页面的对象数及字节数和一些门户网站的相差不大。地图搜索的性能关系到用户体验,也关系到用户是否放弃搜索,使用别的搜索引擎。低通搜索中有一个非常重要的功能,就是搜索到底目的地的线路。通过我们的监测发现,很多搜索引擎目的地搜索的性能非常差,这也是搜索引擎服务商必须关注的一个应用。
  3.综合搜索:部分搜索引擎服务提供商依托自身强大的技术实力,推出综合搜索,综合搜索不需要用户自己筛选搜索条件,只需输入关键字,搜索引擎对返回的信息进行自动分类,如按照新闻、娱乐、商品进行分类,这大大方便了用户的搜索。通过第三方性能监测可获得综合搜索的性能质量,通过数据分析综合搜索的瓶颈,可改善综合搜索性能,使用户在使用方便的情况下,得到良好的用户体验。
  4.网页快照:当网络速度较慢时,用户可以通过网页快照获得信息,由于网页快照保存在搜索引擎服务商的站点,因此网页快照是网络速度较慢的情况下,用户最后的“希望”。如果打开网页快照的速度差,无疑会进一步影响用户体验。
  5.下一页:由于搜索引擎返回的结果是海量的,结果都会分页。分析性能测试的结果会发现,用户组搜索时的速度都比较快,但用户点击下一页时的性能比较差,在网络质量差的时候下一页的结果返回的时间使用户无法忍受,因此对下一页的监测也是非常重要的。
  6. Ajax监测:搜索引擎的部分应用是通过Ajax实现的,比如在搜索框中输入一个关键字,搜索引擎会出现一个下拉列表,这个列表中的信息是与输入的关键字有关的,这种应用的性能对搜索引擎服务提供商也是非常重要的。
  以上的搜索引擎应用都是用户在使用搜索引擎时经常使用的,这些应用的性能对用户是非常重要的,用户对一个搜索引擎的忠诚度,大部分取决于以上应用的性能。
  针对搜索引擎行业的特点,第三方性能质量监测服务商通过如下方式对搜索引擎进行性能质量监测。
  1.单一页面监测
  由于目前国内绝大部分用户Windows平台,因此监测工具采用IE内核,支持Ajax技术、JavaScript、XML、DOM、CSS等。
  2.动态技术监测
  对于使用Ajax以及Flash等技术实现的延时数据加载、异步数据加载技术,在网页完全下载后,还需要进行后续数据通信的监测,通过在监测平台中设置“额外等待时间”,对搜索引擎的地图监测可以使用这种方式。
  3.对搜索引擎的业务进行事务流程处理的监测
  搜索引擎的部分应用是一个完整的业务流程,而这些业务流程在搜索引擎中是最耗费性能的。通过对关键的流程进行性能监测,掌握关键业务的用户体验,找到存在的问题,才能制定有针对性的优化策略。
  在本次测试中,我们对搜索引擎的应用主要进行以下方面的测试:
  1.搜索引擎的Ajax脚本监测,如当用户在搜索引擎文本框中输入一个关键字,我们将记录系统下拉菜单的弹出时间;
  2.关键字搜索的速度,如搜索结果返回的时间、网络层的时间;
  3.监测搜索引擎搜索的结果中是否有用户想要的结果,如:对竞价排名中,用户想知道自己的广告是否能够通过搜索引擎搜索到;
  4.地图搜索所需要的时间。
  测试中,我们以真实用户的身份,定时计次完成真实的在线搜索流程,并对以下测试项目及数据进行记录。测试中,每一个监测点都相当于一个真实的用户,我们将基调网络自主研发的监测工具,安装在分布全国的测试电脑上,通过这些监测点去访问测试网站首页。访问过程中,测试平台的监测端会把用户对搜索引擎的访问过程及数据传回到基调网络的数据中心。测试平台通过运营中心向部署在不同地区、不同运营商的监测点发送监测命令,监测端接收指令访问用户的网站应用。监测端将访问的数据传回到数据中心,数据中心将数据进行挖掘处理,生成各种可视的数据图表,用户通过登录自助服务系统查看数据。
其他文献
2003年5月,美国《哈佛商业评论》刊载了尼古拉·卡尔的题为《IT不再重要》一文,作者提出云计算将让用户像拥有电力一样拥有计算力。一石激起千层浪,美国几乎所有的重要媒体、IT业界巨头、商业界重量级人物和专家学者们都积极发表看法。时至今日,全球经济低迷,企业亟需低成本的运营模式以加强自身竞争力,云计算也吸引了越来越多的眼球。5月22日,IBM在中国举行了首届云计算论坛,IBM同与会嘉宾分享了IBM帮
英特尔在2005年1月17日重组的4年之后,于2009年9月14日再次对其组织架构大刀阔斧地进行了重组。  坊间着实对此热议了一阵。从这些文章的标题看,有就事论事说主要产品部门整合到英特尔架构事业部的,也有说重组是为了给CEO欧德宁腾出时间专注企业战略的,还有说是因为中国读者熟悉的基辛格离职去了EMC的,而笔者发现最多而又最离谱的文章标题是《英特尔重组 为物色CEO接班人做准备》。  西方现代管理
《企业内部控制基本规范》虽然延迟执行,但到2010年年底,执行企业要出具内控自我评价报告,并不充裕的时间或许会大量激发国内安全审计的市场需求。    2009年7月1日,在《深圳证券交易所创业板股票上市规则》正式实施的这一天,原定同日施行的《企业内部控制基本规范》(以下简称《内控规范》)却被悄然推迟至2010年1月1日,而许多企业到目前为止,却并不知道这个信息。  根据官方的说法,延期实施主要是因
爱普生曾经推出过EMP-1810和EMP-1815两款投影机,测试的这一款EMP-1825,从名称来看应该是EMP-1810和EMP-1815的后续产品,应该更好地延续EMP-1810和EMP-1815的优势。  EMP-1825是一款变焦能力很强的投影机,短距离即可投影出较大的投影面积,比较适合教育会议等较大投影环境的应用。 EMP-1825采用了广角投影方式,在2米的距离内即可投影出2.15米
“辉煌六十年——中華人民共和国成立60周年成就展”系统展示了新中国成立60年,特别是改革开放以来,中国共产党领导全国各族人民不懈探索中国特色社会主义道路的伟大历程,系统展示了新中国成立60年来特别是改革开放以来经济建设、政治建设、文化建设、社会建设和党的建设取得的巨大成就,展望2020年全面建成小康社会和到本世纪中叶基本实现现代化的美好前景。    链接:http://www.cio360.net
“轻公司”正在IT业大行其道,它们将商业模式、人、品牌、经验……这些看似最易流动的资产视作命根。“轻公司”尽可能将固定资产最小化,追求高回报率,能外包的业务一概不自己经营。  可偏偏还有另一类公司,它们动辄砸下上亿元资金购置固定资产,并以此为“轻公司”提供IT外包服务而获取利润,我们称这类企业为“重公司”。体态庞大、投资回收缓慢的“重公司”在IT时代怎样生存?同为“重公司”,不同企业又有怎样的不同
大约在2003年左右,IT業正逐渐从网络泡沫崩裂中恢复过来。为了连接各地的大型数据中心,新建了许多新型高速主干网络。这些网络连接的速度高达几千兆比特/秒,而TCP的性能表现在这样的高速网络上却不尽如人意。  当时流行的高速TCP设计主要有两个流派:基于网络丢包的设计和基于网络延时的设计。前者会抢得大量的网络资源,而使得普通TCP的性能极度下降;而后者却恰恰相反,在和大量TCP竞争的情况下,却往往使
本报讯 国内IM(即时通信)广告品牌Myshow Media品牌发布会近日在北京举行。  Myshow Media是社交动漫提供商——秀满天下旗下的全新媒体业务品牌,为MSN、QQ、Skype、阿里旺旺等IM平台独家提供动漫增值内容。借助IM这种强大的互联网平台,Myshow Media以传情动漫、动态头像、聊天表情、聊天背景、形象专区等形式表达广告讯息,使网民因喜爱情境中的角色、故事或创意,对广
3月29日,由CECA国家信息化测评中心主办的“2008年度中国企业信息化500强”大会在京召开。作为已连续6年举办的大型企业信息化年度调查,本次大会以“融合——从企业信息化到信息化企业”为主题,发布了2008中国企业信息化500强调查和测评结果。神州数码信息服务集团集成服务战略本部凭借在企业IT服务管理上的出色成绩荣获“最佳IT服务管理提供商”。据悉,这是继获得“2008中国优秀金融IT产品及解
■ 美国西蒙公司大中国区技术经理陈宇通        数据中心布线系统面临多种挑战,如何提高效率和降低成本是成功的关键。在高密度数据中心中,传统的主干和水平链路配置(如常见的每个EDA机柜接入24根双绞线或24芯光纤)已经不能适应刀片式服务器及SAN存储设备的需求,而由端口数量增加引起的机柜安装单元的占用,又与昂贵的数据中心单位面积成本形成极大的矛盾。    传统的双工跳线和双工光纤连接器件组成的