论文部分内容阅读
随着我国居民生活水平的不断提高,出门旅游日趋成为我国消费者最重要的休闲、放松方式之一。随着全球互联网信息化、规模化、普遍化的发展趋势,人们在出游前会根据自己的需要在网络上查询相关旅游信息,但是传统的搜索引擎在面对指定领域的搜索任务时,经常会查找出很多繁杂的的搜索结果,这其中就包含大量的广告等无关页面。为应对以上的种种情况,笔者专门研究了面向旅游信息进行的垂直搜索引擎的设计方法和实现策略。垂直搜索引擎的产生是由于近些年来人们发现传统搜索引擎查询信息模糊、精度较低的特点等应运而生的全新的一种模式,其在实际运用中有着快速、准确、专业性强的突出特点。所以,面向旅游信息的垂直搜索引擎的设计可以向外出旅行游客提供更加准确、快速和专业的信息。本文的主要工作包括以下几个方面。首先要广泛的搜集旅游行业业务的需求信息。其分析的主要目的是要充分了解垂直搜索引擎在提供旅游业务搜索信息时的所有流程。而信息需求则确定了垂直搜索引擎的信息搜索边界,是进行网页信息过滤的基础。需求分析则是搜集游客们更加关心的旅游信息类型,例如景区交通、信息、住宿、风土人情等等。第二,在分析顾客需求的基础上,要在整体上对面向旅游信息的垂直搜索引擎进行设计。垂直搜索引擎的逻辑结果较繁杂,主要包括了两个方面,即分工清晰明确的前台系统和后台系统。其中向顾客提供查询信息功能的是前台系统,后台系统主要负责搜索页面的信息合成,包括主题蜘蛛、主题词库、网页过滤、信息存储、信息索引、信息抓取等各种功能模块,为游客提供专业、准确的相关信息支持。笔者在研究中以游客的需求为研究的背景,通过自适应算法设计并实现了面向旅游信息的垂直搜索引擎系统,该系统采用向量空间模型对旅游信息的主题进行抓取,同时采用了网页具体内容和网页地址链接分析相结合的方法,使搜索的结果排序更加合理,因此提高了旅游信息检索的准确率和效率。最后,笔者对本文的内容进行了归纳总结,并建设性的提出了未来工作的总体目标,并对所研究的面向旅游信息的垂直搜索引擎系统发展方向做出了一些的展望。