论文部分内容阅读
针对Web信息抽取领域中存在的“项无序”问题,提出了一种基于二维关联边条件随机场模型的Web信息抽取方法。将Web文档解析为一个词性序列,映射待抽取的信息项的状态,映射待抽取的信息项为二维关联边条件随机场中的序列参数,使用归纳算法构造二维关联边条件随机场模型。实验结果证明该方法可以获得更好的抽取性能。