Web页面清洗相关论文
针对Web页面中包含大量噪声信息的问题,提出了一种基于页面布局及XPath技术的自动清洗算法。算法首先对样本页面划分形成的内容块......
文章提出了Web页面清洗的概念,给出了一种基于规则的Web页面清洗方案,并实现了基于此方案的系统。文中的页面清洗建立在Web页面的D......
随着Internet快速发展以及Web信息量的增加,Web成为农民获取农产品供求Web信息的重要渠道。提取并合理地保存农产品供求Web信息,对......