论文部分内容阅读
[摘要] 本文简单介绍了专业搜索引擎,探讨了专业搜索引擎和传统搜索引擎的不同,阐明了其在信息资源中的重要性。
[关键词] 专业搜索引擎 传统搜索引擎
1990年以前,世界上没有搜索引擎。伴随着互联网爆炸性的发展,面对海量的信息,许多人感叹在互联网上“只有想不到的,没有找不到的”。目前, Intrenet 上综合性的传统搜索引擎发展日益成熟, 较好地满足了广大用户的检索需求。但网络技术发展与网络信息增长迅速, 网络信息的用户也越来越多, 相比之下,这些搜索引擎在索引数据库的建设、信息的收集等方面存在很多不足, 导致了信息查准率低、有用信息含量低、垃圾信息多等问题。传统搜索引擎在满足用户的专业检索需求时这些问题尤为突出, 这样难以满足专业人士的检索需求, 2005年6月~7月清华大学图书馆进行了“电子资源建设和使用读者调查”, 发现78%的读者认为利用学术资源的重要途径是搜索引擎, 读者在遇到当图书馆馆藏不能满足需求时, 读者的主要解决办法中有82.4%的读者选择用搜索引擎。因此, 应开发搜索质量更准确、相关性更复杂的搜索引擎, 以追求在某一学科或某一行业领域有最佳的检索效率及效果,各种专业搜索引擎随之产生。
一、专业搜索引擎概述
专业搜索引擎是指应用于搜索某一学科领域或某一类信息(如图像、影像)的专业垂直搜索引擎,是搜索引擎的细分和延伸。是专为查询某一学科或主题的信息而产生的查询工具,是相对传统搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式。它是以构筑某一专题或学科领域Internet网络信息资源库为目标,智能地在互联网上搜集符合这一专题或领域需要的信息资源,能够为包括学科信息门户、专业信息机构、特定行业领域、公司信息中心、行业专家等等在内的信息用户,提供整套的网络信息资源开发方案的信息查询与服务。因此也是当前采集网络信息资源的有力工具,是实现信息资源共享的必不可少的工具。
国内外已有许多优秀的专业搜索引擎。例如, WallStreet Research Network 是由美国WSRN 公司开发建立的经济与财经类的专业搜索引擎,专门检索经济研究、工商企业、市场新闻、共同基金、投资中介商和经济研究出版物等各类信息;皋陶搜索引擎是中国法律互联网查询程序,它收录了大量的中文法律网站,内容全面,分类科学,其法律数据库分为10个大类,上万个细目,包括数千个法律相关网站,是目前互联网上规模最大、最优秀的中文专业搜索引擎。如果用户想找电话、人名、电子邮件、地址等资料,就可以使用专用搜索引擎, 如全球华人寻人引擎(http:// www. look4.com)提供因特网上最强大的寻人功能,拥有100万笔的中文姓名和e-mail 资料;若要检索有关某个电影明星的信息, 那么http://us.imdb. com准会提供很多这方面的信息,提供的信息量远远超过综合大型搜索引擎;还有专门提供有关域名注册信息、域名有效性测试等服务的域名搜索引擎、专门搜索网上免费资料的搜索引擎、地图搜索引擎、城市交通旅游电子地图搜索引擎。
二、与传统搜索引擎的区别
专业搜索引擎和传统搜索引擎虽然都是帮助网络用户进行网络信息定位和查找的工具,但是二者在进行信息服务的时候还是有很大的不同。
传统的综合搜索引擎提供整个互联网上与用户提问相关各种网页信息,然后由用户自己判断结果中的信息哪些是相关的,哪些是不相关的。使用专业搜索引擎的用户通常都有明确的信息需求,同时这种信息需求可以界定在某一个特定范围内,并且满足其信息需求的信息产品是特定形式的结构化的信息,它提供的结果都是与用户需求相关的,用户不用自己再进行分析和判断。
从对关键字的选择上可以看出两者的差异:专业搜索引擎对用户关键字的选择要求很简单,直接输入要查找的产品名称即可得到相关度很高的结果;而传统搜索引擎则要求用户对自己的信息需求很明确,并且完整、准确的表达在搜索栏中,搜索引擎才能够提供一定的相关信息,并且要求用户自行对每一个信息的相关度进行判断。
传统搜索引擎提供的搜索结果是网页链接和关于该网页的简单描述,其中匹配的原则是网页描述与关键字的相关度。而专业搜索引擎提供的搜索结果是结构化的数据,几乎不需要用户具体打开网页就可以断定是否是自己需要的结果。
通过传统搜索引擎所查询的结果往往是数量巨大的,结果覆盖面比较广。而专业搜索引擎因为检索的网站数目有限,所以检索结果的数量也维持在几百个左右。但是,从查准率的角度看,专业搜索引擎的准确率很高,几乎可以达到90%以上。因为这些特定的信息都是在特定的相关网站上查找的,所以可以保证它的准确性。但是对于传统搜索引擎而言,因为搜索引擎在广泛的互联网上查找,另外用户也不可能准确的表达信息需求,所以准确率相对比较低。
综上所述,专业搜索引擎这种高度目标化、专业化的搜索引擎的优势在于,针对性强,对特定范围的网络信息的覆盖率相对较高,具有可靠的技术和信息资源保障,有明确的检索目标定位,有效地弥补了综合性搜索引擎对专门领域及特定主题信息覆盖率过低的问题。同时,能够把具有相同兴趣点的人们集中在一个“主题社区”内,不仅集中提供各种专业资源,而且给大家提供了一个相互交流、共享经验和教训、展望行业发展前景的机会和场合
参考文献:
[1]胡红霞等:搜索引擎技术的现状及发展趋势.信息工程大学学报, 2001 (12)
[3]肖冬梅:垂直搜索引擎研究.图书馆学研究,2003.2
[关键词] 专业搜索引擎 传统搜索引擎
1990年以前,世界上没有搜索引擎。伴随着互联网爆炸性的发展,面对海量的信息,许多人感叹在互联网上“只有想不到的,没有找不到的”。目前, Intrenet 上综合性的传统搜索引擎发展日益成熟, 较好地满足了广大用户的检索需求。但网络技术发展与网络信息增长迅速, 网络信息的用户也越来越多, 相比之下,这些搜索引擎在索引数据库的建设、信息的收集等方面存在很多不足, 导致了信息查准率低、有用信息含量低、垃圾信息多等问题。传统搜索引擎在满足用户的专业检索需求时这些问题尤为突出, 这样难以满足专业人士的检索需求, 2005年6月~7月清华大学图书馆进行了“电子资源建设和使用读者调查”, 发现78%的读者认为利用学术资源的重要途径是搜索引擎, 读者在遇到当图书馆馆藏不能满足需求时, 读者的主要解决办法中有82.4%的读者选择用搜索引擎。因此, 应开发搜索质量更准确、相关性更复杂的搜索引擎, 以追求在某一学科或某一行业领域有最佳的检索效率及效果,各种专业搜索引擎随之产生。
一、专业搜索引擎概述
专业搜索引擎是指应用于搜索某一学科领域或某一类信息(如图像、影像)的专业垂直搜索引擎,是搜索引擎的细分和延伸。是专为查询某一学科或主题的信息而产生的查询工具,是相对传统搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式。它是以构筑某一专题或学科领域Internet网络信息资源库为目标,智能地在互联网上搜集符合这一专题或领域需要的信息资源,能够为包括学科信息门户、专业信息机构、特定行业领域、公司信息中心、行业专家等等在内的信息用户,提供整套的网络信息资源开发方案的信息查询与服务。因此也是当前采集网络信息资源的有力工具,是实现信息资源共享的必不可少的工具。
国内外已有许多优秀的专业搜索引擎。例如, WallStreet Research Network 是由美国WSRN 公司开发建立的经济与财经类的专业搜索引擎,专门检索经济研究、工商企业、市场新闻、共同基金、投资中介商和经济研究出版物等各类信息;皋陶搜索引擎是中国法律互联网查询程序,它收录了大量的中文法律网站,内容全面,分类科学,其法律数据库分为10个大类,上万个细目,包括数千个法律相关网站,是目前互联网上规模最大、最优秀的中文专业搜索引擎。如果用户想找电话、人名、电子邮件、地址等资料,就可以使用专用搜索引擎, 如全球华人寻人引擎(http:// www. look4.com)提供因特网上最强大的寻人功能,拥有100万笔的中文姓名和e-mail 资料;若要检索有关某个电影明星的信息, 那么http://us.imdb. com准会提供很多这方面的信息,提供的信息量远远超过综合大型搜索引擎;还有专门提供有关域名注册信息、域名有效性测试等服务的域名搜索引擎、专门搜索网上免费资料的搜索引擎、地图搜索引擎、城市交通旅游电子地图搜索引擎。
二、与传统搜索引擎的区别
专业搜索引擎和传统搜索引擎虽然都是帮助网络用户进行网络信息定位和查找的工具,但是二者在进行信息服务的时候还是有很大的不同。
传统的综合搜索引擎提供整个互联网上与用户提问相关各种网页信息,然后由用户自己判断结果中的信息哪些是相关的,哪些是不相关的。使用专业搜索引擎的用户通常都有明确的信息需求,同时这种信息需求可以界定在某一个特定范围内,并且满足其信息需求的信息产品是特定形式的结构化的信息,它提供的结果都是与用户需求相关的,用户不用自己再进行分析和判断。
从对关键字的选择上可以看出两者的差异:专业搜索引擎对用户关键字的选择要求很简单,直接输入要查找的产品名称即可得到相关度很高的结果;而传统搜索引擎则要求用户对自己的信息需求很明确,并且完整、准确的表达在搜索栏中,搜索引擎才能够提供一定的相关信息,并且要求用户自行对每一个信息的相关度进行判断。
传统搜索引擎提供的搜索结果是网页链接和关于该网页的简单描述,其中匹配的原则是网页描述与关键字的相关度。而专业搜索引擎提供的搜索结果是结构化的数据,几乎不需要用户具体打开网页就可以断定是否是自己需要的结果。
通过传统搜索引擎所查询的结果往往是数量巨大的,结果覆盖面比较广。而专业搜索引擎因为检索的网站数目有限,所以检索结果的数量也维持在几百个左右。但是,从查准率的角度看,专业搜索引擎的准确率很高,几乎可以达到90%以上。因为这些特定的信息都是在特定的相关网站上查找的,所以可以保证它的准确性。但是对于传统搜索引擎而言,因为搜索引擎在广泛的互联网上查找,另外用户也不可能准确的表达信息需求,所以准确率相对比较低。
综上所述,专业搜索引擎这种高度目标化、专业化的搜索引擎的优势在于,针对性强,对特定范围的网络信息的覆盖率相对较高,具有可靠的技术和信息资源保障,有明确的检索目标定位,有效地弥补了综合性搜索引擎对专门领域及特定主题信息覆盖率过低的问题。同时,能够把具有相同兴趣点的人们集中在一个“主题社区”内,不仅集中提供各种专业资源,而且给大家提供了一个相互交流、共享经验和教训、展望行业发展前景的机会和场合
参考文献:
[1]胡红霞等:搜索引擎技术的现状及发展趋势.信息工程大学学报, 2001 (12)
[3]肖冬梅:垂直搜索引擎研究.图书馆学研究,2003.2