论文部分内容阅读
计算机网络技术的发展使得网上信息资源快速膨胀,并具备了传统信息所没有的海量、分布性、变化快、无结构化等特点。这些特点的出现向人们利用信息的能力提出了挑战。目前人们主要通过过搜索引擎在网上定位信息,基于Internet的各类搜索引擎应运而生并得到了迅速发展。其中Yahoo、Baidu、Google等通用搜索引擎功能虽然非常强大,但用它们来精确查询信息时,返回结果精度不高。垂直搜索引擎正是一种对非结构化数据进行精确检索的搜索引擎。随着信息的爆炸增长以及信息多元化的发展,垂直搜索引擎的研究正成为热点和发展趋势。
本论文的工作主要是设计及开发了一个展会垂直搜索服务网站。论文首先对开源全文检索工具包Lucene的体系架构和主要功能模块进行了剖析。在对Lucene主要索引算法(增量算法、归并算法和查找算法)原理进行解析的基础上,在项目中使用Lucene的检索能力完成了展会海量数据的快速检索,并且引入了第三方电子支付PayPal来支持检索结果的在线购买及支付,最后使用ASP.NET开发环境下的三层框架实现了该网站。
论文主要深入分析和使用了以下关键技术:
①Lucene支持海量展会数据的快速检索技术。
②PayPal支持展会搜索结果的在线购买及支付技术。
③基于ASP.NET的三层框架设计及相关设计模式。
论文在网站中主要设计及实现了以下功能:
①基于Lucene的通用关键字对展会的搜索。
②基于Lucene多条件下的对展会的高级搜索。
③基于Lucene按时间,地点,种类等多种方式浏览展会。
④基于模板的搜索结果显示。
⑤生成并导出基于CVS、Excel格式的搜索结果。
⑥搜索结果下载模块。
⑦搜索结果的导出与下载的收费管理。
⑧搜索和下载日志的记录及管理。
⑨错误日志的记录及管理模块。