一种基于Wati J的Deep Web蜘蛛研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:szjisu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DeepWeb中相当一部分内容因为动态网页存在而不能进行有效抓取。为此,设计并实现一种基于Web自动化测试工具——WatiJ的DeepWeb网络蜘蛛。阐述利用WatiJ实现用户提交查询表单、循环点击翻页按钮等拟人交互方式的原理,通过实例给出动态网页抓取的关键步骤。实验结果表明,该蜘蛛是针对授权数据源进行动态网页抓取的一种有效解决方案。
其他文献
随着国际经贸往来与经济交流的日趋频繁,亚洲乃至世界范围的货币合作已经取得初步进展,与此同时,货币职能也早已突破了国家的界限,多种货币开始具有国‘际竞争力,货币竞争现
经过50多年的发展,我国绿茶加工及其机械化作业技术的研究和产品的开发取得了显著的成效。上世纪60年代以前,重点是研究和总结传统制茶工艺技术,以及研制、开发制茶机具和机械化
党的十六大提出要实行依法执政,这是一项重大的理论创新.法治精神是文明的政治意识的内核;法治以法制体系的规范性来促进政治行为的有序化;法治以其可预见性保障着政治行为所
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
学校精细化管理就是要用精细的眼光实行细致的管理,扎实认真地落实管理责任,盘活人力资源,实现“人人都管理 处处有管理,事事见管理”,以获取精品的结果。学校管理更应如此,要实行
采用ISSR分子标记技术对川渝茶树资源进行了遗传多态性分析。结果表明,川渝茶树资源遗传多态性丰富,12条ISSR引物共产生100条扩增带,其中多态性条带90条(占90.0%)。ISSR标记遗传相似
语文阅读教学对于培养学生的想象力具有独特的优势,文章试从创设形象、领略内涵、彰显个性化解读等方面,对培养学生的想象力进行一些探讨。
对西部边疆地区高校信息化档案馆管理体系进行了研究。尤其是以具有代表性的内蒙古工业大学的信息化档案馆管理工作为例,阐述了对于西部边疆地区的高校档案馆的改革试点工作
时事政治在每年中考政治科中都占一定的比例,而时事政治涉及面广,内容多、新,要掌握有一定的难度。为此学习时事的过程中,教师授课时应注意一定的复习技巧。如果复习得当,就