基于样本实例的Web信息抽取

来源 :河北大学学报(自然科学版) | 被引量 : 0次 | 上传用户：winddss

【摘要】

：

主要研究了基于HTML文档的信息抽取,提出了一种基于样本实例的Web信息抽取的方法.用户首先选定样本页面和预先定义模式(基于O-R模型),然后对样本页面和其中的样本记录进行标

【作者】

：

张绍华徐林昊杨文柱薛文玲李天柱

【机构】

：

河北大学

【出处】

：

河北大学学报(自然科学版)

【发表日期】

：

2001年4期

【关键词】

：

HTML 模式抽取器信息抽取 WEB查询 INTERNET INTRANET HTML schema information extraction W

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

主要研究了基于HTML文档的信息抽取,提出了一种基于样本实例的Web信息抽取的方法.用户首先选定样本页面和预先定义模式(基于O-R模型),然后对样本页面和其中的样本记录进行标记、学习,形成信息抽取规则,并存入知识库;利用知识库对其他同类页面自动抽取所需的信息,存入数据库中.本方法可用于Web查询,也可用于信息集成的包装器.

其他文献

出版的效益难题和编辑的人格追求

期刊

出版工作社会效益经济效益编辑人格追求

基于样本实例的Web信息抽取

其他学术论文