基于DOM模型扩展的Web信息提取

来源 :计算机科学 | 被引量 : 0次 | 上传用户：liongliong568

【摘要】

：

提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构，对DOM树结点进行语义扩展并计算其影响度因子，依据结点的影响度因子进行剪枝，进而提取Web页面信息内容

【作者】

：

顾韵华田伟

【机构】

：

南京信息工程大学计算机与软件学院

【出处】

：

计算机科学

【发表日期】

：

2009年11期

【关键词】

：

文档对象模型 WEB信息提取影响度因子 DOM树扩展 DOM Extraction of information from Web pages Influ

【基金项目】

：

本文受江苏省产业技术研究与开发基金项目（苏发改高技发[2006]1106号）资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构，对DOM树结点进行语义扩展并计算其影响度因子，依据结点的影响度因子进行剪枝，进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识，具有自动和通用的特点。提取结果除可以直接用于Web浏览外，还可用于互联网数据挖掘、基于主题的搜索引擎等应用中。

其他文献

“三全育人”视阈下高职会计专业育人机制构建

【摘要】本文分析“三全育人”视阈下高职会计专业育人机制建构要素，阐述“三全育人”视阈下高职会计专业育人机制建构的必要性，提出构建高职贫困生帮扶机制、改善高职院校育人环境、明确互联网思政教育的育人地位、引导学生建设自我管理与教育机制等构建策略，从而创设“三全育人”的优质教育环境，为高职学生全面发展奠定基础。　　【关键词】三全育人高职院校会计專业育人机制构建　　【中图分类号】G 【文献标识码

期刊

三全育人高职院校会计专业育人机制构建

揠苗助长

【成语出处】《孟子·公孙丑上》:"宋人有闵其苗之不长而揠之者……苗则槁矣。"【成语释义】把禾苗拔高,来帮助它成长。比喻违反事物发展规律,急于求成,反而坏事。【近义

期刊

事物发展规律公孙丑上循序渐进欲速则不达揠苗助长成语释义近义成语急于求成

一类具有“开端”结构的安全协议分析方法研究

开端协议（Open-ended Protoc01）的分析是安全协议领域中一个待解决的重要问题，而IKE则是一个有代表性的具有“开端”结构的安全协议。本文基于串空间的Athena方法，针对IKEv2协议

期刊

开端协议DIFFIE-HELLMANSECURITYASSOCIATION串空间ATHENAOpen-ended protocol Diffie-

让音乐回归音乐课堂

《音乐课程标准》在其实施建议中提出＂以音乐为本＂。＂以音乐为本＂就是要突出音乐学科自身的特点。我们应在新课程理念引领下,在教学实践中去探索更有效的途径,让音乐回归音乐课堂

期刊

音乐新课程透视探索回归

晚期血吸虫病合并高钾血症的分析

晚期血吸虫病(以下简称晚血)伴有腹水的患者,因利尿剂应用及补钾不当.可引起血钾过高,而高钾血症的病例可致严重后果,却易被人们所忽视,本文就我院收治的3例晚血合并高钾血症

期刊

晚期血吸虫病高钾血症肝硬变腹水保钾利尿剂安体舒通肾功能损害阿托品碳酸氢钠心电图二氧化碳结合力

基于多旋回模型预测四川盆地天然气储量增长趋势

开展四川盆地天然气储量增长趋势预测研究,进一步明确未来勘探潜力,论证天然气业务发展主要指标的合理性,为中长期战略目标制定提供科学依据。四川盆地天然气探明地质储量发

期刊

四川盆地天然气储量多旋回预测Hubbert模型GAUSS模型GM(12)灰色Sichuan BasinNatural-gas reserv

Mathematica的非线性拟合功能及其在物理学中的应用

介绍了Mathematica的曲线拟合命令，并利用该命令求出了爱因斯坦温度和钠光谱中的线系限与量子数亏损．

期刊

MATHEMATICA非线性拟合物理学应用Mathematica nonlinear fit physics application

一种基于核集与相似性的模糊推理方法

在稀疏规则库条件下，当给定的输入落入规则“间隙”时，采用传统的模糊推理方法是得不到任何结论的。学者已经证明模糊推理本质上就是插值器。Koczy和Hirota首先提出了KH线性插

期刊

模糊假言产生式模糊集相似性多维稀疏模糊推理Fuzzy set Core and similarity Sparse fuzzy reasoning

一种有效率的基于图的关系学习算法

多关系数据挖掘根据表示形式可以分为基于图的MRDM和基于逻辑的MRDM。本文讨论了基于图的数据挖掘和基于图的关系学习之间的关系，重点介绍基于图的关系学习算法Subdue及其优缺

期刊

多关系数据挖掘基于逻辑的MRDM基于图的MRDMSubdueMulti-relational data mining Logic-based MRDM

慢性骨髓炎负压封闭引流术的疗效观察及护理体会

目的分析慢性骨髓炎负压封闭引流术(VSD)的疗效及护理体会。方法选取2019-04—2020-04间郑州市骨科医院收治的42例慢性骨髓炎患者,均给予VSD治疗和精心护理。回顾性分析患者

期刊

负压封闭引流技术慢性骨髓炎治疗效果护理

基于DOM模型扩展的Web信息提取

与本文相关的学术论文