基于Deep Web的图书信息集成与查询系统

被引量 : 0次 | 上传用户:wfj0808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该系统是使用在手机上的图书搜索系统,通过搜索,可以为用户提供基本的图书信息查询,并将查询结果显示在手机屏幕上,方便手机用户查阅。在本文中,笔者提供了一种基于Deep Web(深网)技术的网络爬虫以实现对特定主题的网络信息的收集、整合,该爬虫被设计成一个基于JAVA语言的多线程的多级队列爬虫,在这个队列中采用HTMLParser工具和正则表达式技术对抓取的URL进行处理和存储。在URL队列的设计上引入了Berkeley DB,实现了队列的高效存取,并将抓取到的数据存入MySql数据库。笔者采用基于Lucene技术对处理后的信息建立索引,在成功收集资源并建立索引后,笔者基于软件Android,当今最重要的手机开发平台建立了一个搜索界面,以方便用户使用手机通过Web搜索到与特定主题相关的资源。该系统可以为手机使用者提供方便快捷的信息服务,用户可以随时获取所查询的图书的各类信息,为用户带来了便利。
其他文献
采用激光拉曼光谱对不同生产阶段自来水样品的硬度指标进行了研究,测量了水样品拉曼谱的弯曲振动峰与伸缩振动峰强度的比值,并计算了样品在伸缩振动拉曼峰处的退偏振度.结果
为使嫦娥二号卫星CCD立体相机在100km高度的圆轨上能够获取地元分辨率力为7m的图像,设计了一种两线阵立体测绘CCD相机光学系统。介绍了两线阵立体测绘相机的工作原理。根据卫
<正> 我国刑法第187条明确规定玩忽职守罪的主体是国家工作人员,但其他法律性文件对玩忽职守罪主体范围的规定却很不一致,从而引起我国刑法学界和司法界对玩忽职守罪的主体的
北京城市规划延续至今的人造太阳系模式,目前已经进入了非良性的红巨星期,难以胜任为城市长远发展提供健康的基本空间框架的职能。为使相对的衰落和绝对的兴起达成辨证的统一
结合湖州的案例,旨在探讨在当前的城市发展背景下,如何利用城市的重大市政工程契机,更好地制定、运用城市政策报告,挖掘城市水文化内涵,引导城市特色水景观建设,进而达到城市水文化
酒店基层员工的高流失率一直是制约酒店发展的一个瓶颈问题,而基层员工的工作倦怠程度则是导致他们离职的一个主要原因。本文通过对广州市多家酒店的基层员工进行问卷调查,发
工程造价动态管理可以避免房屋建筑的价格受政府单一管理的模式,有利于真实地反映房屋建筑的价值。
<正>1前言镁合金具有密度低、比强度及比刚度高、导热性能好、易于切削加工等优点,除此之外镁合金易于回收,可以实现100%的循环再利用,符合循环经济的发展方向。因此,镁合金
本文从样本工程中提取影响酒店装饰工程该项目成本的因子,将主成分分析法与多元线性回归模型相结合,通过施工企业保存下来的与影响因子相关的信息与数据,建立了对酒店装饰工
文章论述了引入市场机制,发展教育产业的重要意义。并指出要激活教育产业的发展,使之成为促进经济增长的新亮点,必须实现“三大创新”,正确处理“四大关系”。