包装器生成相关论文
虚拟数据库技术是近几年兴起的一种新型的数据集成技术,它是计算机网络和数据库技术交叉应用的结果。建立虚拟数据库的目的是为用户......
包装器信息抽取技术是当今的一个研究热点。目前出现了基于不同原理的多种包装器信息抽取技术,它们具有不同的性能。介绍了包装器......
提出一种基于竞争分类的Web信息抽取方法,以信息片段与样本之间的相似度作为竞争力,通过信息片段对信息模板槽的竞争实现对信息片......
针对现今较流行的动态Web网页数量巨大、数据价值高,并且网页结构高度模板化的特点,设计了一个基于网页聚类的Web信息自动抽取系统。......
提出一种从搜索引擎返回结果页面上自动抽取结果记录及后续页面链接信息并生成Wrapper的方法:对于一个有效的结果页面,通过比较其HTM......