一种基于视觉特征的Deep Web信息抽取方法

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:manaijin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web数据库的不断增长,大量网络信息通过普通搜索引擎难以满足用户的需求,需要用户提交表单查询并从后台数据库中返回结果页面才能获取到想要的信息,称为Deep Web。因此如何有效地抽取这些实体信息成为一个值得研究的问题。论文通过分析Deep Web结果页面的特点,结合人的视觉特征,提出了一种基于视觉特征的Deep Web信息抽取方法。该方法充分利用了人的视觉特征,在解析器将Web文档解析成语法树之前,将Web页面一些与主题无关的信息(例如导航栏、广告)等去除,并对优化后的DOM树利用VIPS算法对
其他文献
根据轮盘赌策略提出了一种基于改进轮盘赌策略的交互式演化算法(RS-IEA),并将其应用于求解商业海报的设计上。商业海报的设计问题可建模为一个隐式性能优化问题,传统的优化算法不
目的:观察肺康复联合无创通气治疗慢性阻塞性肺疾病的临床效果。方法:选取80例慢性阻塞性肺疾病患者作为研究对象,依据随机数字表法分为研究组和对照组,每组40例。两组患者均
对硅溶胶以及含硅溶胶无机建筑涂料的性能进行了分析和测试,将其与碱金属硅酸盐类无机涂料的性能差异进行了比对,结果表明,硅溶胶无机建筑涂料有着良好的使用性能。
目的:探讨基于超声引导的腹横肌平面阻滞(TAPB)联合全身麻醉对结直肠癌根治术患者的影响。方法:选取116例拟行择期结直肠癌根治术患者作为研究对象,依据随机数字表法将其分为
扩展双星树(T(n)n1,n2)是n-1长路径的两端点分别联结n1条悬挂边和n2条悬挂边所得到的图。论文根据扩展双星树的结构特征,研究了扩展双星树的类Wiener指数,给出了一般计算公式。
玉米是我国主要的农作物,用途很广,玉米品种类型多,适应多种生态环境及栽培条件。既可春播、夏播,也可秋播,既可净作,也可与麦类、豆类和薯类等多种作物间作套种。是提高单位
土壤重金属污染频繁发生,人们越来越重视重金属污染土壤的修复。近年来,随着分子生物学的发展,有许多学者对蚯蚓修复重金属污染土壤进行了大量研究。本文对重金属污染对蚯蚓
国办发[2018]23号各省、自治区、直辖市人民政府,国务院各部委、各直属机构:《2018年政务公开工作要点》已经国务院同意,现印发给你们,请结合实际认真贯彻落实。2018年4月8日
蔬菜种植作为农业经济的主体部分,在现代社会生活中有着重要作用。而蔬菜种植的质量深受其种植技术的影响,所以,本文将对大棚蔬菜种植中应注意的技术向题进行分析和罗列,从而
水稻主要经济产量构成因素是有效穗数、每穗结实粒数和粒重,在生产实践中,我们常常盲目地追求密度,导致水稻穗数过多,每穗粒数、结实率、粒重反而下降,造成了减产。在穗数少