基于文档结构的信息抽取规则的描述语言比较研究

来源 :河北大学学报:自然科学版 | 被引量 : 0次 | 上传用户:obzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于文档结构的信息抽取工具很多,XWrap,W4F,Lixto以及自主开发的PQagent是其中比较有代表性的几个.这几个工具采用了不同的规则描述形式,XWrap,W4F,Lixto使用的是自定义的规则描述形式,PQagent采用了通用的规范XQuery来描述规则.现将XWrap,W4F,Lixto使用的规则描述形式与PQagent采用的XQuery进行比较,说明了采用XQuery描述抽取规则的优越性.
其他文献
以流体机械能守恒定律为依据,建立了流动相在液相色谱系统中的流体动力学模型P=k1+k2 qu,并以典型的液相色谱系统证明了其正确性,即流动相的体积流量和其在色谱流动系统中产
指出了"不精确概念的表示理论(Ⅰ),(Ⅱ)"一文中命题3.3中性质5,X≈αRYXUYC=U,X∩YC=Φ和命题2.1存在的2个错误,并给出了相应的修正.
实验采用分子烙印技术合成了对农药三唑醇有特异性作用的分子烙印聚合物(molecularly im-printed polymer,MIP).通过平衡吸附实验,评价了其对三唑醇的亲和力和选择性.与非烙
经过近二十年的高速发展,中国通信产业经历了从固定向移动、从窄带向宽带、从基础语音业务向基础业务与增值业务并举的重要转变。就现在的发展而言.中国已经与世界同步.无论是业
华为近日宣布,与高通成功完成CDMA DORA与IMS网络的互通性商用实验,合作打通全球首个基于IMS网络的IP分组电话,这将对移动通信的运营模式产生重大影响。凭借此项技术,全球CDMA用
简要介绍了入侵检测技术,研究将数据挖掘技术应用于网络异常检测,应用数据挖掘中的关联分析方法和序列模式分析的方法提取网络审计数据中的正常或异常的行为模式,这种模式用
设P(G)=λ(λ-1)r1…(λ-m)rm,则称(1,r1,…,rm)是一个指数序列.本文证明了,当m=n-1,若1≤i<i+c≤n-1,则当ri=ri+c=2,rk=1,(k≠i,i+c),并且1≤i≤c+2时,该序列是一个广义树序
众多的电信业务组成了一个复杂的产品体系.电信企业需要借助高效的信息化系统来管理这个产品体系,以便实现企业的经营目标。本文将简单探讨中国网通与英国电信及华为公司就电信
在对用高压高频电源驱动的介质阻挡放电时空动力学研究的过程中,针对高压高频信号难以测量的问题,采用高压自屏蔽的方法,解决了高压漏电流引起的分压电阻过热的问题,实现了高
日前,惠普公司宣布推出新的产品和客户成功案例,以帮助全球电信公司打造和交付新一轮移动服务。包括南非Vodacom和西班牙Telefonica Moviles公司在内的多家领先移动运营商已部