网页正文提取中与正文无关的图像清除技术

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:cin_long
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因为图像相比文字具有更强的表现力,站点的设计者在设计广告时考虑的首要问题是如何吸引用户的"眼球",所以通常网页中的广告通常都是以图像的形式嵌入到网页中。这使得在HTML网页正文提取中主要处理的就是广告图像。文中综合分析了网页中图像的特点,提出了区域分块的HTML元素删除法来清除网页中的广告等无关图像并提取网页正文。实验结果表明,所提出的区域分块的HTML元素删除法很好地解决了网页正文提取中图像处理问题。
其他文献
1  题1:博尔赫斯的《环形废墟》,做梦的魔法师最终发现自己也不过是别人梦中的产物时,心头种种滋味。下面哪一个不是他的感受:  A、宽慰 B、悔恨 C、屈辱 D、惶恐  题2:卡尔维诺的《树上的男爵》,柯西莫因为拒绝吃蜗牛爬上了树。他拒绝的是什么蜗牛?  A、葡萄蜗牛 B、玛瑙蜗牛 C、条华蜗牛 D、庭院蜗牛  题3:大卫·米切尔的《幽灵代笔》,有一章是四川的“圣山”,它可能是哪座山?  A、峨眉
如何实现电子技术课程与学生互动式的教学,调动学生学习的积极性。在探索理论教学、实验实训教学结合起来的实践中,营造了和谐的多方位互动氛围教学场景,实现了理论与实践融合互
更多时候,我们能进入世界的最佳方式就是阅读小说,好的小说常常能在文学虚构和生活真实之间凿开一个狭窄的甬道。妁暗经验》无疑属于这类小说。故事的情境是虚构的、荒谬的,同时
图像插值是数字图像处理中最基本、最重要的技术之一。文中设计提出一种新的边缘方向算法得到高分辨率图像的插值,并且把这个放大算法运用在人脸识别中。在很多视频监控中,尤其是当目标人脸离摄像头距离非常远,获得的目标人脸图像通常比较小,以至于难以对目标人脸图像进行正确的识别。文中首先提出了一种基于统计处理图像放大方法,使图像放大后更为清晰和易辨。然后应用主成分分析(PCA)和径向基函数网络(RBF)方法对放
针对分布式数据库中数据的分布性、事务执行的分布性和一些不可预测的软件错误和硬件故障等原因导致的数据不一致性问题,指出解决这些问题尚存在的困难,分析了消息队列法、事
角点是图像中的重要特征,在图像配准与匹配、运动分析、目标识别、目标跟踪等领域中均得到了广泛的应用。Moravec和Harris算法是计算机视觉领域中应用比较广泛的角点检测方法