基于 XML的Web数据抽取模型研究

来源 :西华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:yhmlivefor47
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种面向HTML或XML描述的Web数据抽取模型,首先用STOCK把Web文档从Web服务器读下来,识别Web文档的表示格式,若是HTML格式,则先把HTML数据转换成XHTML(XML的子集)格式,然后对Web页进行修复后合并形成系列XML文档并存储,采用绝对路径和锚点(Anchor),利用XML数据格式的工具来检索相关数据,获取所需数据并构造XML输出,从而实现Web数据抽取过程.实验表明,该模型实现Web数据抽取是可行的,根据该模型的缺陷,提出了一个基于语义Web技术的信息抽取改进模型.
其他文献
按照传统格栅设计的计算方法,利用ObjectARX和可视化的面向对象的编程语言Visual C++进行程序设计,开发AutoCAD,基本上实现了格栅的参数化设计,完成了根据输入参数实现自动绘图的功能.
脑梗死(CI)是最常见的脑血管病,部分患者可以复发,复发性CI的临床特点及辅助捡查改变国内报道较少。2005年1月~2011年2月收治CI患者318例,其中复发120例(37.7%)。从剩余246例
磁浮列车的非线性自适应控制,采用精确线性化与数字控制相结合,在得到系统参数同时考虑列车模型参数的时变性。其精确线性化步骤含:求解微分方程、定义反馈控制及反馈线性化
随着我国社区医疗卫生服务工作的深入开展,社区卫生服务机构的接诊量在不断上升,在患者取药时,药学人员除了要认真无误地审核、调配处方,还要告知患者如何使用药物、用药后有
目的探讨连续性血液净化治疗重度烧伤脓毒症患者的疗效及临床分析。方法 2008年7月至2012年7月期间,本院诊治的64例重度烧伤脓毒症患者,随机将其分为对照组(常规治疗)和观察
目的 探讨黛力新对功能性消化不良伴抑郁患者的临床治疗效果.方法 选择我院2010年7月至2011年9月功能性消化不良伴抑郁患者80例,随机分为两组,对照组40例,给予常规治疗,治疗
目的 观察康莱特注射液治疗晚期恶性肿瘤患者生活质量的变化.方法 将46例患者随机分成治疗组(25例)和对照组(21例),两组患者均给予一般性对症支持治疗,治疗组在此基础上加用
随着医院管理的科学化与会计本身的改革和快速的发展,医院的会计电算化管理应运而生,通过在医院工作中的许多实例可知,会计电算化在医院日常的财务管理当中,有着举足轻重的作
民间建筑反映民间文化,它是民间物质文化与精神文化的共同体现,既离不开对物质条件的依托,更离不开思想观念的指导,又是人们追求理想生活、讲究好尚、遵守禁忌等精神意识的体
[目的]评价高压注射及X线介入输卵管复通术对输卵管性不孕症患者的临床治疗效果。[方法]选取输卵管性不孕症患者92例,随机分为造影组和介入组,分别行X线子宫输卵管造影、高压