面对互联网高速拐点的到来

来源 :科技智囊 | 被引量 : 0次 | 上传用户:frigate999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  据中国互联网络信息中心近日发布的《第19次中国互联网络发展状况统计报告》显示,截止到2006年底,我国网民人数已达到1.37亿,占全国人口总数的10.5%。这一数字标志着互联网发展的高速拐点已经到来,预示着中国互联网将迎来更快速的增长期。可以说,Internet和Web已经改变了人们的学习、生活和工作等各个方面,它们的影响力已渗透到社会的各个层面,而这一切才刚刚开始。面对互联网高速拐点的到来,我们能做什么?
  Vannevar Bush在1945年提出的Memex代表了人类长久以来的一个梦想:让每个人都可以十分容易的访问人类积累下来的知识并且十分容易的共享自己的见解。Memex被描述成一个存放了无数本书籍的书桌,这些书籍的内容被超链接互相连接起来,同时其它形式的知识载体,如图片、声音录音等也被放进来。人们可以通过链接在Memex中浏览,也可以通过简单的界面,比如口头的命令来搜索和查询。人们还可以共享自己对书籍阅读的注解。
  Web的出现使Memex不再仅仅是一个梦想。万维网(World Wide Web,简记为Web)起源于1989年欧洲粒子物理研究室CERN,最初计划是由CERN的物理学家Tim Berners-Lee于1989年3月提出,在1993年2月,随着第一个图形界面Mosaic的发布而开始迅速发展。据估计每年Web流量增加100%,每天增加大约100万的新网页。到2004年4月,Google声称提供对4,285,199,774个网页提供检索服务,但这还只是Web上已有网页中很小的一部分,Web的核心技术是超文本和超媒体,它通过将文本,图形,图像,音频,视频等信息的有机结合,给人们提供丰富的信息表示空间。同时Web使得信息发布变得前所未有的简单,也让信息浏览十分方便。整个Web相当于一个巨大的知识库,越来越多的文本、书籍被数字化提供在线服务,越来越多的文字以数字化的形式创建和存储。
  Web规模的迅速增长和内容的不断丰富,也给人们进行有效访问带来了困难。人们需要Web具有Memex中那样理想的搜索和查询的功能,以帮助自己快速、准确地在信息的海洋中找到自己需要的内容。搜索引擎正是由这样一种需求推动而得到快速发展的信息服务形式。根据统计,约85%的用户使用搜索引擎去定位他们需要的信息,并且,几个著名的通用搜索引擎一直都稳定地处于全球访问量最大的50个网站之列,搜索引擎已经成为了人们进行信息获取的一个基础设施。
  
  搜索引擎的今天
  
  竞争格局基本稳定。自1990年由加拿大的麦吉尔大学(McGillUniversity)学生Alan Emtage、PeterDeutsch、Bill Wheelan发明的Archie(Archie FAQ)开始,网络搜索工具经过十几年的研究和发展,到2006年底,全球搜索引擎市场的规模已达到204亿。其中,Google占据了50%的市场份额,其它就是雅虎和MSN,整个市场呈现高度垄断的竞争态势。从竞争层面来看,Google的领先优势更为明显。而我国的搜索引擎市场,从产业规模上来看,2002年时中国搜索引擎只有2.5亿元的规模,到2006年以年均60%的速度增长,已达到56.6亿,用户规模达到了8300万。其中,百度在中国搜索引擎市场中已经达到了52%的比重,而Google和雅虎相对来说有一定的下降。但是,Google和雅虎的竞争实力依然还是非常强大,未来整个市场的格局还没有一个定数。同时,第二阵营像搜狐和新浪还是有着比较强劲的增长空间,特别是2006年搜狗在积极营销策略的带动下份额有所增长。在搜索引擎这个市场中,新进入者的主要目标则更多的是瞄准新的领域尤其是垂直搜索。
  在竞争格局基本稳定的前提下,厂商发展策略差异化主要体现在发展渠道和推广策略方面:百度重点是直销,Google是代理商的模式。这两种模式各有优劣,将来会有所体现、调整或者发展。
  新增领域渐成焦点。搜索引擎已经成为网民最重要的在线活动,70%的网民都使用过搜索引擎。尤其值得关注的是企业用户对搜索引擎的认识逐渐在加深,这也促进了搜索引擎盈利模式的创新。但是,随着互联网上的信息越来越多,通用搜索带给人们的搜索体验并不是很好。往往在输入某个关键字后,搜索到的有用信息并不多。这样一来,一些带有目的性的搜索,比如搜索酒店、搜索机票或者找工作方面,就需要依靠一些专业的搜索引擎来完成。而垂直搜索开始大行其道,在很大程度上也正是基于通用搜索这些缺陷的日渐显现。
  垂直搜索和通用搜索的不同点主要有:1、产生的背景不同。通用搜索的产生背景是因为互联网上的网页太多,用户无法找到自己想要的网页,而垂直搜索的产生是因为两个原因:第一,用户从通用搜索中想要找到自己想要的某一个特定领域的信息时,需要花费大量的时间。例如,对于求职而言,如果用户在google中输入“java开发”,得到的结果都是讲java开发技巧的,要想看到关于“java开发”的职位,需要不断的翻页;第二,领域性网站数量的日益增多,以招聘来说,现在国内的招聘网站可以说是上千家,而用户想要得到全面的招聘信息,就需要一个网站、一个网站地打开去看,耗时耗力。2、受限领域。垂直搜索一定是针对用户在某一个方面的需求,专门搜索该方面的内容,例如:房地产搜索、汽车搜索、招聘搜索等。3、定向信息采集。垂直搜索所用的信息采集器是针对某一主题的站点列表进行抓取。4、信息抽取。垂直搜索中一项很关键技术就是信息抽取(IE:Infor-mation Extraction),呈现给用户的是经过抽取整理后的内容,而不是一个简单的摘要加上网页链接。5、排序技术。假如一个关键词的网页有10万个,那到底哪个该排在第一个?通用搜索引擎通常都是分析一个网页中链接了多少个其它的网页,加上其它网页链接到这个网页有多少个,再加上更新时间,然后做一个数学运算得到最后的排序权值。而现在所有的垂直搜索都是采用了按相关性和时间交叉排序的方法。此外,在结果页面呈现方式、核心技术以及索引结构等方面,通用搜索与垂直搜索均有不同程度的差异。搜索引擎的明天
  曾被喻为创新机器的Google,连同盛极一时的Google神话,正在全球范围内经历一个不可逆转的去魅过程。面对诸多创意迭出的第三代搜索引擎的出现,人们不禁要问:Google还在创新吗?
  第二代搜索的软肋。作为Google排名运算法则的核心,PageRank算法假定:某个网页被链接得越多,则该网 页的等级和重要性就越大,从而在相关性排序中也就越靠前。PageRank的等级以PR值计算,PR值越高说明该网页越重要。虽然Google的排名算法实际上要远为复杂,比如还揉合了Title标识、Keywords标识等上百个参数和变量,但囿于关键词搜索本身的局限,Google并没有在搜索结果的相关性等指标上与其竞争对手拉开距离。
  大体而言,第二代搜索的局限见于如下四个方面:其一,提供的提问函数相当有限;其二,仅支持单个关键词或者一组关键词及逻辑运算符组成提问,而并不支持自然语言搜索或语义搜索,所以关键词与搜索结果之间的匹配很难做到精准,往往是搜到哪儿算哪儿;其三,不能利用历史信息进行搜索。用户的每次搜索都是从头开始,而不能从原有的查询结果中作进一步选择;其四,呈现方式单一、呆板。多数搜索引擎只返回一个长长的搜索结果列表,其中可能有数以万计的包含关键词的网页,但这些网页是否以及在多大程度上与用户的搜索意图相关,则不得而知。
  事实上,第二代搜索引擎所具有的局限性,也困扰着Google这样的搜索巨头。
  浮现中的第三代搜索。作为对第二代搜索的一种超越,第三代搜索的范式革命不光见于呈现方式,而是表现为参差多态的演化路径,例如个性化搜索、社会化搜索、本地化搜索、知识问答社区、社区内容搜索等等。而在核心搜索技术上,则大致包含人工智能、模式识别、语义分析、神经网络等发展方向。由于神经网络搜索和人工智能搜索耗资巨大,目前还没有出现成型的搜索引擎,不过,包括Google、微软、IBM、Roussinov等在内的搜索引擎,均已将人工智能搜索的研发提上了议事日程。在国内,Aisou等公司也跃跃欲试,随时准备推出人工智能搜索产品。
  值得一提的是,Autonomy的模式识别技术本身也包含有语义分析技术和部分人工智能技术。虽然迄今为止,计算机还无法做到完全理解语言,但通过采用基于统计学、概率论和信息论的概念识别技术,Autonomy可以理解信息的意义和信息间的连接。用户搜索时可以直接以自然语言输入一句话或一段文字,甚至一篇文章,Au-tonomy会自动判断用户查询条件所描述的概念,从企业文档库中查找所有和用户搜索概念相关的文档。显然,语义搜索比传统关键词搜索更能精准定位用户的搜索意图。
  由于是基于对概念和概念之间关系的理解,Autonomy还可以利用精选内容中完整的上下文,实现概念提炼或基于例子的提炼,进而聚焦用户所感兴趣的概念结果,并提供自动建立档案、社区及协作、信息自动推送等个性化搜索功能。不光如此,该系统还可以自动判别使用者的身份,并通过不断学习更新系统的知识库。
  瞄准当前互联网前沿技术和未来发展趋势,由北京市计算中心开发的垂直搜索服务器ContentSmart集软硬件为一身,将信息智能采集、快速中文实时检索、信息智能分选、WEB发布、远程后台管理等功能有效地结合在一起,开始在电子商务、电子政务、情报搜集整理、竞争情报分析、门户网站建设的领域应用,正在产生良好的经济效益和社会效益。
  关于第三代搜索,众多的创新者已经为我们勾勒出一个美好而粗犷的轮廓,我们可以预言并且相信的是,浮现中第三代搜索引擎今后的进化之旅,还会有很多很多超出我们今天的想象。
  
  (本文由北京市科学技术研究院北京市计算中心提供)
其他文献
十七大刚刚落幕,带给新时期的中国更多的思想动力和方向指引其中不乏思想创新和理论创新。本期专题即从学习十七大开始,系统将十七大的有关内容进行梳理,从“理论创新有深意、小康目标新要求四位一体的事业布局——建设富强、民主、文明、和谐的中国特色社会主义”三大方面解读十七大报告,以便让我们的读者一册在手,对十七大的主要内容有一个全面、整体的认识。  十七大报告中,一个引人注目的焦点是“软实力”,作为一个西方
期刊
时事·胡锦涛·内政活动    1.3月16日,胡锦涛发布中华人民共和国主席令第六十二号,公布并实施《中华人民共和国物权法》发布中华人民共和国主席令第六十三号,公布并实施《中华人民共和国企业所得税法》。  2.3月23日,胡锦涛主持中共中央政治局第四十次集体学习,他强调,认真学习全面实施物权法,开创社会主义法治国家新局面。  3.3月30日报道,胡锦涛根据全国人民代表大会常务委员会的决定任免驻外大使
期刊
慧从何处生?佛说,慧从定中来,定以戒为前提。戒、定、慧,是佛法修行的全部,也是获得至高智慧的必由之路。  对于我们普通人来说,获得无上正等正觉、究竟圆满的智慧是个极高的目标。但成为一个有思想、有见地的人并不难达到,其中的路径是相通的。  我们的思想从哪里来?从“凝固的时间”中产生。试想,你在思考一个问题时,你的脑海中浮现的是问题的对象物,以及对象物的时间和空间关系,那么现实中的时间似乎被凝固了、空
期刊
融资瓶颈问题被业内人士称之为中关村乃至整个中国高新技术产业发展的“哥德巴赫猜想”,投融资机制的不完善,不仅严重阻碍了我国科技成果的转化,而且也影响了我国创新能力的提升。投融资何以成为瓶颈  目前,在我国特别是在北京、上海、广东等地区,创业投资环境日趋完善,创新投入机制不断建立,为城市创新型建设提供了有力的支撑和保证。但是,真正的创业投资行为仍然偏少,一些企业尤其是一些高新技术的中小企业,投融资问题
期刊
编者按:  似乎在一夜之间,中国的创意产业已经如火如荼地在各地发展起来,有关创意产业的书籍不断出版,创意产业园区陆续挂牌运营,创意产业政策接连发布实施,与创意产业有关的各种会议更是一个接着一个。随着创意产业概念的流行和媒体的大力宣传,人们对创意产业的了解越来越多,创意产业发展的成功案例,也再次激发人们通过创意去创业的热情。可以说,中国创意产业的发展远远超出了人们原来的预计,它如同中国改革开放以来的
期刊
企业董事会和CEO是否明确了“I”(信息)的基本原则,是否参与到治理的具体实践过程中去,是IT治理执行得好坏的关键。只有在明确了“I”的基础上,企业才能建立起与企业的战略和业务相配套的、合理的IT治理构架。  通常人们看IT都是把“I(Informa-tion信息)”和“T(Technology技术)”放在一起,但实际上,那个“I”要大得多。管理层首先应当考虑的是信息怎么用,信息政策怎么去铺开,以
期刊
在南部沿海地区热火朝天地进行“腾笼换鸟”的同时,在北方,一幅“凤舞云台”的美妙图画也正在铺展开来。  何为“腾笼换鸟”?这指的是南部沿海一些先发展起来的工业区、开发区为了实现经济增长方式的转变和经济结构的战略性调整,把高消耗、高排放、高污染、低附加值的产业所占用的资源和空间腾出来,“换上循环经济之鸟”,用循环经济的发展理念,推进生产生活生态联动,从而全面提升国际竞争力,赢得更大的发展空间。  经济
期刊
夫《易》广矣大矣,以言乎远则不御,以富乎迩则静而正,以言乎天地之间则备矣。    这句话是在前一章节的基础上继续对《易》的理解阐述,字面上不难理解。《易经》既广且大,涵盖的内容无边无际。在《易经》里面,说到“远”的概念就是无边无际,句中的“御”就是边际的意思,不御就是没有边际,那是真正的远;与远相对应说到“近”,句中“迩”就是近的意思,就会近到细微,近到几乎静止,端正无邪。如果再推演开来,说到天地
期刊
编者按:  一个上世纪九十年代美国国际问题专家提出的语汇,如今已成为国内自上而下谈论的焦点,并首次出现在十七大报告中,“软实力”的影响力和渗透力可见一斑。有“软”必有“硬”!“软实力”的提出正是基于“硬实力”增强的前提。在30年突飞猛进般高速增长后,中国的“硬实力”确实让中国人的身板“硬”了起来,如今到了不得不谈“软实力”建设的时候了,如同人登山爬坡的时候需要左右脚的交替一样,这的确是一件好事,说
期刊
9月,由中国企业联合会和中国企业家协会评选的“2007中国企业500强”新鲜出炉。  今年的评选标准有哪些不同?哪类企业最强势?哪些行业最红火?哪些区域最风光?2007中国的500强,与历史相比、与世界相比,强在哪里?弱在哪里?500强的背后带给我们哪些启示?  带着这些问题,我们全面透视07年中国500强。    中国企业500强评选标准有哪些变化?    2007年中国企业500强申报表中,包
期刊