论文部分内容阅读
针对煤矿安全事件信息的特点,提出了基于煤矿安全事件的Web信息抽取方法,主要包括页面清洗、抽取规则生成、Web信息抽取。页面清洗作为预处理阶段,用于删除Web页面中的HTML标识、脚本、css段等无用信息;抽取规则生成是根据信息特征,定位信息在页面的位置;通过实验验证基于煤矿安全事件的Web信息抽取方法的可行性,结果表明本文提出的信息抽取方法针对中小型规模的信息抽取具有很高的准确性和有效性。