校园网搜索引擎——图像搜索

来源 :北京机械工业学院 北京信息科技大学 | 被引量 : 0次 | 上传用户:chinafeed
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通用搜索引擎和多媒体信息快速的发展,图像搜索引擎成为国内外的一个研究热点,文字信息的搜索已经不能满足人们的需求,人们对多媒体信息的需求越来越迫切,其中最常用的就是图像,由此互联网图像搜索引擎应运而生。大型的搜索引擎数据量太大,结构太复杂,不太适合校园网,目前我们学校的校园网搜索引擎功能有文件搜索、网页搜索等,但图像搜索这里还是一个空缺。 本课题研究和实现了校园网网页上图像信息的抓取、下载、索引和检索,最终完成了一个简单而又较为完整的校园网图像搜索引擎系统。本课题讨论了爬虫程序的抓取策略,通过对爬虫程序(Spider)的改进,利用正则表达式、sql队列、定时器等相关技术,实现了对校园网图像及网页信息的抓取和下载,并对干扰图像进行了过滤处理,同时对校园网外的网站进行了屏蔽。用IKAnalyzer中文分词系统来实现中文分词,通过Lucene的常用的一些API实现了索引的建立、增加和查询。采用Jsp+Tomcat服务器的BS架构来实现图像检索模块,并取得了良好的效果。
其他文献
随着网络技术的迅速发展,基于Web的应用已经从局部化发展到全球化,从集中式发展到分布式,从以人为中心的Web发展到以应用程序为中心的Web,即Web服务。Web服务的出现带来了一
多视点视频(Multi-View Video/3D Video)是针对交互式多媒体应用提出的,其所涵盖的双目立体视频与多视点视频播放将在未来几年中实用化,它将解决3D交互视频的表现、交互、存储
由于P2P网络自身的特点使得在P2P网络环境中解决安全问题十分复杂。早期的P2P网络应用基本没有考虑安全因素,后来发展的一些P2P网络应用系统虽然有自己的安全机制,但是不具有
蓝牙通信技术迅速发展,蓝牙技术在手机应用领域迅速扩大,免提已经成为蓝牙手机的标准应用。在蓝牙手机普及过程中,人们迫切希望手机中的资源——电话簿能够以一种便利方式在
随着P2P计算模式的兴起、网络带宽的增加和Internet计算能力的迅速增强,如何充分利用这些资源,在动态的P2P网络环境中构建高可扩展、高可靠、高性能的分布式计算系统,是近年
专业学位教育是我国教育事业的组成部分之一。随着专业学位教育的发展和办学形式的多元化,专业学位研究生规模不断扩大,教务信息越来越多,教务管理工作的管理模式与管理水平之间
隐喻指用一类事物描述另一类事物。隐喻在语言文字中是普遍存在的。历史上,学者对隐喻的看法大多停留在修辞手法的层面上。随着语言学研究的深入,人们开始对隐喻有了全新的认识
随着计算机视觉技术和机器学习技术的飞快发展,人脸识别技术应用在了生活的各个领域,例如身份识别和智能交互界面等。人脸识别是一种高维大数据集模式识别的典型应用。但数据维
中国汽车技术研究中心盐城汽车试验场是国内第一家具有国际认证的试验场。该试验场在前期市场调研期间针对国外数家专业汽车试验场进行学习,并仔细研究试车场试验车辆管理需求
无线传感器网络是当前国际上备受关注的、有多学科交叉的新型前沿研究热点领域。它是一种连接传感器、激励源和处理器的新型无线自组织网络。它综合了传感器技术、嵌入式计算