基于填充标记的自适应Web信息提取

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:baimeimei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种自适应Web信息提取算法,基于自底向上规则模块层叠,通过在提取模板中填充一定数量有助于识别信息类别的SGML标记,较好地覆盖Web页中不可见信息,有效控制自适应过程中信息的过少和溢出,实现智能化Web信息提取.
其他文献
提出了一种基于2R树的双时态二维空间索引模型BT2D-Index.该模型是依据降维的思想将双时态索引2R树和基于事务时间的时空索引2R树整合而成的,给出了BT2D-Index的2R树实现模型
在充分理解相关度概念的基础上,提出了一种基于权值的结果优化排序方法,综合考虑用户需求,包括兴趣权值、人数权值和位置权值,并采用固定容量的网页索取模式,实现了一个小型
对利用白腐菌产酸特性进行黑液处理的工艺条件进行了初步的探讨 ,研究了驯化后的一株产酸白腐菌处理造纸黑液过程中 pH ,COD及色度的变化 ,在最适条件 (初始pH值 6~ 7,黑液负荷 1.3× 10 4 mg/L以下 ,接种量体积分数 2 0 %~ 3 0 % ,微氧状态 ,温度 2 5~ 2 9℃ )处理下 ,pH值降低到 2左右 ,色度与COD的去除率均保持在 60 %以上
在虚拟环境中 ,对人体头部变形曲面提取特征并参数化 ,建立基于弹簧质点系统的标准几何模型 ;借助重叠图像拼接技术形成纹理图像 ;根据纹理图像调整几何模型特征参数 ,配准图形和图像形成特定的变形几何模型 ,再把拼接图像纹理映射到变形几何模型上 ,得到一种真实感人体头部模型 .
为了考察动物能量密度的分布规律,考虑到目前动物能量密度研究多限于陆生动物,补充测定了72种常见水生无脊椎动物的能量密度,对近230种动物的能量密度的分布规律进行了分析研
给出煤矸石组分模式识别的模糊神经网络模型 ,提出一种实用生态算子 ,同时将此基础上构建的生态遗传算法用于模糊神经网络的离线学习 ,能有效避免传统BP算法学习速度慢、易陷入局部极小的缺陷和基本遗传算法的遗传滑脱现象 .仿真和实验结果显示新算法使离线训练的网络具有良好的收敛性能 ,而且从训练好的定量网络中提取模糊规则用于原煤的在线自动分选 ,不仅能提高煤中矸石的识别率 ,而且有效解决了系统识别精度与实