基于主题的网络爬虫系统的研究与实现

来源 :科学与信息化 | 被引量 : 0次 | 上传用户:k854642
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高校软件教学中有效学习资源获取困难的现状,拟通过对开源的网络爬虫框架Heritrix进行二次开发,在爬虫的网络资源识别、数据筛选等功能点上开展研究工作,提出一种基于主题的数据采集方案,并在此基础上实现一种基于指定主题的网络爬虫系统,以满足高校软件教学对高质量学习资源的需求。
其他文献
行政事业单位资产清查工作根本目的是为细化预算编制和编制部门预算提供真实依据,规范和加强行政事业单位国有资产管理,提高行政事业单位国有资产使用效益。为进一步推动财政预
主要从理论上分析了产生地电流干扰的原因,从而在实践上提出了一些经常被忽略,却是非常行之有效的方法来减小地电流的干扰,设计出高质量的电路。
泵站信息化建设是排水事业现代化建设的重要组成部分。加强计算机网络建设,推进信息化建设的目的是学习先进的管理思想、制定科学的管理制度、应用先进的管理技术,从而加快排
介绍红外遥控自动收费系统的设计原理及应用,该系统的三个组成部分:单片机编码的红外发射电路,单片机解码的红外接收电路及数据库模块。接收器对10米半径内,大于90度范围的信号有准确
电费核算,是电费管理工作的中枢。电费是否按照规定及时、准确地收回,账务是否清楚、统计报表数值是否准确,关键在于电费核算的工作质量。电费核算是电费管理的重要环节,科学
随着我国医疗卫生体制改革深入,医疗市场竞争激烈,使得医院经营存在很多不确定因素,给医院财务带来风险。本文分析了医院财务风险的成因,并对医院财务风险管理提出应对措施。
在介绍临港白酒产业链特点的基础上,对白酒产业链上的主体进行了物流金融服务的供给与需求分析。提出供需博弈模型,并用于验证临港白酒产业链的物流金融服务供需博弈过程,指
本文从集团研发项目的实际出发,结合近几年项目技术管理经验,提出了通过对需求管理的改进方法来提高研发项目的管理水平,保障科研工作的顺利进行,实现高效率的科研工作。
介绍一种采用EPROM、可控硅等元件组成的程序可变化、可重写并可直接控制强电通断的电路。
ERP沙盘模拟课程采用体验式的教学模式,注重培养学生综合素质。本文介绍了笔者在教学过程中的一些体会和思考。