一种基于视觉特征的Deep Web信息抽取方法 - 论文文献免费下载 - 搜论网

一种基于视觉特征的Deep Web信息抽取方法

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户：manaijin

【摘要】

：

随着Web数据库的不断增长,大量网络信息通过普通搜索引擎难以满足用户的需求,需要用户提交表单查询并从后台数据库中返回结果页面才能获取到想要的信息,称为Deep Web。因此如何有效地抽取这些实体信息成为一个值得研究的问题。论文通过分析Deep Web结果页面的特点,结合人的视觉特征,提出了一种基于视觉特征的Deep Web信息抽取方法。该方法充分利用了人的视觉特征,在解析器将Web文档解析成语法树

【作者】

：

孙璐陈军华廉德胜

【机构】

：

上海师范大学

【出处】

：

计算机与数字工程

【发表日期】

：

2016年03期

【关键词】

：

Deep Web 视觉特征 DOM树语义分块信息抽取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Web数据库的不断增长,大量网络信息通过普通搜索引擎难以满足用户的需求,需要用户提交表单查询并从后台数据库中返回结果页面才能获取到想要的信息,称为Deep Web。因此如何有效地抽取这些实体信息成为一个值得研究的问题。论文通过分析Deep Web结果页面的特点,结合人的视觉特征,提出了一种基于视觉特征的Deep Web信息抽取方法。该方法充分利用了人的视觉特征,在解析器将Web文档解析成语法树之前,将Web页面一些与主题无关的信息(例如导航栏、广告)等去除,并对优化后的DOM树利用VIPS算法对

其他文献

基于改进轮盘赌策略的交互式演化算法磁

根据轮盘赌策略提出了一种基于改进轮盘赌策略的交互式演化算法（RS-IEA），并将其应用于求解商业海报的设计上。商业海报的设计问题可建模为一个隐式性能优化问题，传统的优化算法不

期刊

交互式演化算法轮盘式选择隐式优化问题商业海报最优化设计interactive evolutionary algorithmroulette wheel

肺康复联合无创通气治疗慢性阻塞性肺疾病的临床效果

目的:观察肺康复联合无创通气治疗慢性阻塞性肺疾病的临床效果。方法:选取80例慢性阻塞性肺疾病患者作为研究对象,依据随机数字表法分为研究组和对照组,每组40例。两组患者均

期刊

肺康复无创通气慢性阻塞性肺疾病

分析硅溶胶及含硅溶胶无机建筑涂料的性能

对硅溶胶以及含硅溶胶无机建筑涂料的性能进行了分析和测试,将其与碱金属硅酸盐类无机涂料的性能差异进行了比对,结果表明,硅溶胶无机建筑涂料有着良好的使用性能。

期刊

硅溶胶无机建筑涂料性能

基于超声引导的腹横肌平面阻滞联合全身麻醉对结直肠癌根治术患者的影响

目的:探讨基于超声引导的腹横肌平面阻滞(TAPB)联合全身麻醉对结直肠癌根治术患者的影响。方法:选取116例拟行择期结直肠癌根治术患者作为研究对象,依据随机数字表法将其分为

期刊

结直肠癌手术麻醉TAPB免疫预后

扩展双星树的Wiener-E指标和Wiener-O指标

扩展双星树（T（n）n1,n2）是n-1长路径的两端点分别联结n1条悬挂边和n2条悬挂边所得到的图。论文根据扩展双星树的结构特征,研究了扩展双星树的类Wiener指数,给出了一般计算公式。

期刊

扩展双星树Wiener距离Wiener-E指标Wiener-O指标double star graph Wiener distance Wiener-

关于杂交玉米栽培技术的研究

玉米是我国主要的农作物,用途很广,玉米品种类型多,适应多种生态环境及栽培条件。既可春播、夏播,也可秋播,既可净作,也可与麦类、豆类和薯类等多种作物间作套种。是提高单位

期刊

杂交玉米管理防治

蚯蚓及其代谢物在重金属污染土壤修复中的应用研究进展

土壤重金属污染频繁发生,人们越来越重视重金属污染土壤的修复。近年来,随着分子生物学的发展,有许多学者对蚯蚓修复重金属污染土壤进行了大量研究。本文对重金属污染对蚯蚓

期刊

蚯蚓代谢物重金属污染土壤修复作用

国务院办公厅关于印发2018年政务公开工作要点的通知

国办发[2018]23号各省、自治区、直辖市人民政府,国务院各部委、各直属机构:《2018年政务公开工作要点》已经国务院同意,现印发给你们,请结合实际认真贯彻落实。2018年4月8日

期刊

国务院办公厅政务公开工作印发市人民政府直属机构自治区

试论大棚蔬菜种植中应注意的技术要点

蔬菜种植作为农业经济的主体部分,在现代社会生活中有着重要作用。而蔬菜种植的质量深受其种植技术的影响,所以,本文将对大棚蔬菜种植中应注意的技术向题进行分析和罗列,从而

期刊

蔬菜种植技术病虫害防治

水稻高产栽培要点

水稻主要经济产量构成因素是有效穗数、每穗结实粒数和粒重,在生产实践中,我们常常盲目地追求密度,导致水稻穗数过多,每穗粒数、结实率、粒重反而下降,造成了减产。在穗数少

期刊

水稻高产栽培每穗粒数播期安排良种选用水稻穗产量构成因素合理施肥苗床管理有效穗数生产过程

与本文相关的学术论文