基于树编辑距离的页面语义区域识别

来源 :第六届中国Rough集与软计算学术研讨会(CRSSC'2006) | 被引量 : 0次 | 上传用户:zxw364963027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然网页设计者一般将相关内容放在同一页面,但是网页通常包含如广告、导航栏、版权信息等与页面主题关系不大的信息,同时也可能包含多个主题.如果将整张网页作为最小不可分割的基本信息实体进行处理,会受到较多干扰;如果能对页面进行语义分割,识别出相关语义区域进行处理,可以提高网页信息获取的精度和效率.本文研究树编辑距离,Web页面语义区域划分和基于树编辑距离的页面语义区域识别。
其他文献
运动特征作为视频数据所独有的信息,是视频检索的重点研究对象,但很多关键帧算法都没有考虑运动信息.本文先从每个镜头的P帧中挑选出符合预先要求的关键帧构成决策属性,再从M
会议
在第二次世界大战中被美国飞机炸毁了的柏林最大的人民大剧院,最近重新建立起来了。为了庆祝这个戏院的重新开幕,特地上演了席勒的名剧「威廉·退尔」。这个剧本是由德意志
自模糊集提出以来,许多的模糊推理方法被提出作为模糊环境下推理的数学工具.众所周知,模糊推理已成为了理论基础,以及设计模糊控制器的重要工具,并在工业某些领域应用中取得
会议
期刊
The paper probes into a series of meaningful and constructive work accomplished by Shenzhen government on foreign CVD investigations.Specifically, this paper an
为了解决多代卫星测高数据之间的不协调性问题,本文基于误差验后补偿理论,提出将传统的交叉点平差整体解法简化为两步处理法,即首先使用条件平差法对交叉点观测方程进行平差
会议
本文基于较原始的基于像数网格点信息模式匹配识别算法的基础上进行,而近年来在数字识别领域的一些新的特征提取和特征的选择方法:例如:穿越次数特征,基于笔画方向的特征,周
会议
目的:通过临床药师对合并机会性感染艾滋病患者实施药学监护的过程,探讨药师在临床治疗中发挥的作用。方法:针对具体病例,协助医师为患者制订有效的治疗方案;为患者建立药历,
目的:了解广东省人民医院国家基本药物的使用现状,并为进一步促进我院国家基本药物合理应用提供依据。方法:对我院2009-2011年国家基本药物品种覆盖率、使用金额比例、用药频
高校在进行本科生毕业论文综合评价工作中,通常要组织一批专家或老师,对每个学生的论文情况按照指标进行打分,再综合得出该学生的论文成绩,并把它作为一条历史数据,录入数据