基于XPath比较的Web数据抽取方法

来源 :郑州大学学报:理学版 | 被引量 : 0次 | 上传用户:whjsdsdsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了从包含多个数据块的页面中抽取数据的方法.通过对比各个数据块的XPath,发现这些数据块具有相似的XPath,提出一种基于XPath比较的数据块抽取规则生成算法XERG.得到各个数据块抽取规则之后,块内的信息可以使用相对XPath或者正则表达式的方法来进行抽取.实验结果表明,该方法能够准确地获得各个数据块,正确抽取块内信息.
其他文献
采用真空热压扩散连接法制备出冶金结合的钢铜铝复合材料,采用电解腐蚀法对所制备的复合材料从铜侧进行分层腐蚀,并结合扫描电镜(SEM)、能谱分析(EDS)和X射线衍射(XRD)对所腐蚀德连接
利用扫描电镜(SEM)和盐雾腐蚀试验等手段,研究了镁合金在不同电导率溶液中微弧氧化处理生成陶瓷层的生长规律及耐蚀性.结果表明:随溶液电导率的增大,发生微弧氧化现象的起弧
采用声电沉积工艺在炭/炭复合材料表面制备了磷灰石生物活性涂层,借助SEM,EDAX,XRD,FTIR等分析测试手段,考察了超声频率对涂层组成、结构和形貌的影响。结果表明:低超声频率时(25kHz)
利用溶胶-凝胶技术制备了TiO2氧敏薄膜,通过氧化物掺杂和贵金属的表面修饰,在空气气氛下烧结氧敏薄膜.结果表明:600℃~800℃下处理的薄膜是以金红石为主晶相及少量锐钛矿的混
研究了添加0.5at%和1.0at%Zr对钐铁合金微结构和相组成的影响.添加和不添加Zr的Sm-Fe合金相比,发现添加1.0at%Zr可以基本消除铸态组织中的a-Fe,并且能同时减少富钐相.多添加1
在室温下,应用对靶直流磁控溅射设备在普通玻璃基片上制备了FePt(30nm)/Ti(tnm)颗粒膜样品,随后,在真空中进行了原位退火。详细研究了Ti衬底层对FePt颗粒膜的微结构和磁特性的影响。X
采用溶胶-凝胶法制备不同含量Fe^3+掺杂的纳米氧化钛粉体,利用X光衍射仪研究了氧化钛凝胶的相变过程,分析了产物的晶体结构、金红石转变量和锐钛矿晶粒尺度。试验结果表明,Fe^3+的
以钛酸四丁酯和Mg(NO3)2为原料,采用溶胶-凝胶法在较低的热处理温度下制备了Mg^2+掺杂的TiO2薄膜,并研究了TiO2薄膜光催化降解甲基橙的情况。采用DTA、XRD、SEM等研究测试手段,发现
采用差示扫描量热仪(DSC)研究了大块金属玻璃Pd40Ni10Cu30P20的结构弛豫.结果表明金属玻璃Pd40Ni10Cu30P20的结构驰豫可分为2个阶段:在400 K~520 K的温度范围,样品发生的是低
采用溶胶凝胶法制得的NASICON先驱体粉末,通过热压烧结的方法制备了一系列的NASICON(x=2)陶瓷,并对所得NASICON陶瓷的相组成、显微结构和电性能等进行了分析和讨论。结果表明,随着