农业垂直搜索引擎的研究与设计

来源 :中山大学 | 被引量 : 0次 | 上传用户:jy8578
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,互联网络上的信息量正在以几何级数的增长速度增长,因此,对网络上信息的高效检索成为互联网发展必须要解决的问题,搜索引擎技术得到了特别的重视并且正在飞速的发展。但是,当使用综合型搜索引擎来检索专业内容时,由于其结果存在范围性广、搜索目的不准确的缺点,往往找不到用户们需要的内容。随着电子商务和农业信息化的发展,网络中的农业数据开始高速增长,农业用户使用网络获取相关数据和资源也日益普及,增强了农业用户对信息搜索的依赖性。大部份农业信息网站的“网站内”数据库搜索模式不能满足人们对农业数据搜索越来越多的要求。   本文以用户对农业信息搜索需求为研究背景,在我国农业信息化日益发展之际,结合现今流行的垂直搜索理念和技术,以国内互联网上的农业信息电子商务网站和政府农业信息网站的农业信息为特定的抓取对象,进行自动采集,来实现农业信息的搜索功能。为了实现农业信息的全文检索,引入Lucene全文搜索引擎来实现系统的全文搜索功能。   本文首先阐述了搜索引擎的基本原理以及垂直搜索的关键技术,然后对基于JAVA的Lucene全文搜索引擎技术进行必要的说明,最后在对农业信息搜索业务分析的基础上,实现系统的基本功能需求和最终目标。   在实现系统功能需求和目标的基础上,运用UML分析设计技术和系统三层架构思想,对系统的功能设计和数据库设计进行了详细论述。   本系统在Windows+ Microsoft SQL Server2005+IIS+ASPX开发环境下,设计开发了农业信息搜索网站系统,在Windows+ Eclipse+JAVA+Microsoft soLServer2005开发环境下,设计开发了搜索系统的后台管理系统。因此,本文还对Ajax,eUML建模工具和.NET Framework框架进行了必要的说明。在此基础上,对系统各部分的功能实现进行了简要说明。
其他文献
随着现代社会的发展和人们安全意识的提高,越来越多的重要场合,如车站、机场、银行、政府部门、居民社区等,都需要对人的身份进行鉴别。生物特征识别是一种利用人的生理或行
伴随着网络的发展,文本分类技术成为信息处理领域中重要的研究方向,通常用于处理和组织大量文本数据。蒙古语在中国来说是少数民族语言,蒙古文信息处理发展较慢,但在民族文化
蒙古族现在所使用的文字有传统蒙古文、托忒蒙古文和新蒙文三种文字。目前这三种文字主要采用人工转写的方法来实现文字之间的转换。当今时代是高科技迅速发展的信息化时代,
云计算作为计算机行业新兴技术的一个重要组成部分,其运行性能的好坏直接影响到处理大规模问题的效率。对此,探求优化组合智能算法是目前云计算研究的重要任务,同时也具有相
随着生物信息学的发展,生命科学数据呈爆炸式增长,迫使人们寻求强有力的数据管理和分析工具。数据挖掘是目前最有效的数据分析手段,用于发现大量数据所隐含的各种规律。在生
秘密共享是信息安全和数据保密的重要手段,可有效防止重要信息和秘密数据的丢失、毁坏、被恶意修改或被不法分子利用等。(k,n)门限秘密共享具有良好的性质,成为秘密共享中最
在过去的几十年内,数据采集能力的提高以及存储容量的增长,导致了科学研究的很多领域中信息量急剧增长,它向人们提供更加丰富、细致的信息的同时也造成了大量的信息冗余。在机器
随着我国海运事业的发达,为了改善港口船舶交通秩序、减少船舶交通事故、促进港口安全监督管理的现代化,各主要港口都在兴建船舶交通管理系统(VTS系统),采用先进的雷达系统、
在信息技术飞速发展的带动下,机器学习领域中的半监督学习自从产生便不断发展壮大,在丰富了数据挖掘、统计研究等相关领域的同时,也为其他学科实现快速发展提供了更好的机遇
传感器网络作为新兴的测控网络技术是能够自主实现数据采集融合和传输应用的智能网络应用系统。传感器网络是逻辑上的信息世界与真实的物理世界紧密结合,从而真正实现“无处