论文部分内容阅读
随着互联网的发展和普及,Internet上的信息急剧增长,能够自动获取适用,简单和精炼的信息,成为人们的迫切希望。同时针对农村互联网条件差而手机越来越普及的情况,我们设计实现了一个基于WEB信息抽取和GSM的主动服务系统。本文在分析农产品供求信息网页结构的基础上,提出了一种基于内容和web文档结构路径(DOM)相结合的信息抽取算法。最后实验结果说明该抽取算法能够很好地制定抽取规则并能够准确的抽取所需要的内容。