论文部分内容阅读
“目前的搜索引擎是基于信息检索理论,只能给出与关键词匹配的结果,返回页面罗列了过多无组织的结果,而且还有许多重复结果,搜索精度太低。”智能语义搜索引擎Yebol创始人兼CEO尹红风博士表示。
在中国自动化学会模式识别专业委员会为纪念钱学森逝世一周年举办的“钱学森对科学的伟大贡献与智能搜索研讨会”上,中国自动化学会理事长、中科院院士戴汝为和尹红风的演讲,让与会者看到了思维科学在提高搜索体验方面的新尝试。
搜索引擎的新思维
很多人眼中的钱学森是“两弹一星”元勋、中国航天之父 。知道钱学森是流体力学和控制论方面权威的人就不多了,钱学森晚年对思维科学的探索更鲜为人知。
作为钱学森回国后的第一位助手,戴汝为在协助钱学森的学术工作的同时,还将钱学森在美国所著的学术名著《工程控制论》译成中文。早在1990年,钱学森、戴汝为和于景元在《自然杂志》上发表了《一个科学新领域——开放的复杂巨系统及其方法论》,从而催生了复杂巨系统这一交叉学科。如今的互联网、工业过程模拟、复杂系统仿真等基于高性能计算的应用,都被认为是开放的复杂巨系统或者需要运用到巨系统的方法。由此足见钱学森等科学家的远见卓识。
到了1989年,钱学森两次复信戴汝为,高度评价了戴汝为及其博士生尹红风的4万多字的长篇论文《论思维与模拟智能》。他同时认为,人脑是由数万亿个脑细胞组成的开放的复杂巨系统,并就思维科学和模拟智能的研究方法论提出了自己的见解。
在目前的搜索引擎看来,互联网再大、发展再快,也都是由网页组成的,甚至比世间万物都是由100多种元素组成的要简单得多,它只关心含有与搜索关键词匹配的网页以及这些网页被链接的权重。
而在思维科学看来,互联网是一个承载着从社会科学到自然科学在内、巨大的而且还在不断增长的知识库。应用系统科学、人工智能和模式识别等方法,从思维和知识层面对互联网进行搜索,比仅从关键词匹配对互联网搜索更能提供精确的搜索结果。
Yebol的新尝试
在雅虎总部数据挖掘研究部门工作5年后,尹红风离职创办了Yebol公司,开始了以思维科学为指导的在搜索领域的实践。
尹红风表示,信息的特点是孤立、局部、线性和静态的,是以数据为中心并且符号化了,网上信息无序、无结构而且冗余。而知识是综合、整体、相互关联和动态的,是以人为中心并且个性化和概念化的,而且知识是有序、可分类、层次化和结构化的。
“语义智能搜索提供有组织的分类结果,并把搜索和浏览结合起来,不仅让用户快速、精确地找到所需的信息,而且还可以提供个性化的搜索结果。”尹红风说,“我们要建立像人一样的世界知识库,提供基于知识的语义智能搜索和应用服务。”
如今的搜索引擎把互联网这一开放的复杂巨系统视同相似的网页,不失为复杂问题简单化的处理方法,但这种方法难以提供精确的个性化的搜索结果。而事实上,现有搜索的商业模式也建立在这种不精确的基础上,这样才有更多的搜索结果页面來承载关键词广告。
智能语义搜索虽然刚刚起步,却给网民带来新的希望。
在中国自动化学会模式识别专业委员会为纪念钱学森逝世一周年举办的“钱学森对科学的伟大贡献与智能搜索研讨会”上,中国自动化学会理事长、中科院院士戴汝为和尹红风的演讲,让与会者看到了思维科学在提高搜索体验方面的新尝试。
搜索引擎的新思维
很多人眼中的钱学森是“两弹一星”元勋、中国航天之父 。知道钱学森是流体力学和控制论方面权威的人就不多了,钱学森晚年对思维科学的探索更鲜为人知。
作为钱学森回国后的第一位助手,戴汝为在协助钱学森的学术工作的同时,还将钱学森在美国所著的学术名著《工程控制论》译成中文。早在1990年,钱学森、戴汝为和于景元在《自然杂志》上发表了《一个科学新领域——开放的复杂巨系统及其方法论》,从而催生了复杂巨系统这一交叉学科。如今的互联网、工业过程模拟、复杂系统仿真等基于高性能计算的应用,都被认为是开放的复杂巨系统或者需要运用到巨系统的方法。由此足见钱学森等科学家的远见卓识。
到了1989年,钱学森两次复信戴汝为,高度评价了戴汝为及其博士生尹红风的4万多字的长篇论文《论思维与模拟智能》。他同时认为,人脑是由数万亿个脑细胞组成的开放的复杂巨系统,并就思维科学和模拟智能的研究方法论提出了自己的见解。
在目前的搜索引擎看来,互联网再大、发展再快,也都是由网页组成的,甚至比世间万物都是由100多种元素组成的要简单得多,它只关心含有与搜索关键词匹配的网页以及这些网页被链接的权重。
而在思维科学看来,互联网是一个承载着从社会科学到自然科学在内、巨大的而且还在不断增长的知识库。应用系统科学、人工智能和模式识别等方法,从思维和知识层面对互联网进行搜索,比仅从关键词匹配对互联网搜索更能提供精确的搜索结果。
Yebol的新尝试
在雅虎总部数据挖掘研究部门工作5年后,尹红风离职创办了Yebol公司,开始了以思维科学为指导的在搜索领域的实践。
尹红风表示,信息的特点是孤立、局部、线性和静态的,是以数据为中心并且符号化了,网上信息无序、无结构而且冗余。而知识是综合、整体、相互关联和动态的,是以人为中心并且个性化和概念化的,而且知识是有序、可分类、层次化和结构化的。
“语义智能搜索提供有组织的分类结果,并把搜索和浏览结合起来,不仅让用户快速、精确地找到所需的信息,而且还可以提供个性化的搜索结果。”尹红风说,“我们要建立像人一样的世界知识库,提供基于知识的语义智能搜索和应用服务。”
如今的搜索引擎把互联网这一开放的复杂巨系统视同相似的网页,不失为复杂问题简单化的处理方法,但这种方法难以提供精确的个性化的搜索结果。而事实上,现有搜索的商业模式也建立在这种不精确的基础上,这样才有更多的搜索结果页面來承载关键词广告。
智能语义搜索虽然刚刚起步,却给网民带来新的希望。