Web表格信息抽取技术的研究

来源 :2008年中国信息技术与应用学术论坛 | 被引量 : 0次 | 上传用户:zhangxueyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上有大量信息采用HTML表格表示,由于HTML不描述数据的内容,机器不能理解和查询。论文利用HT池表格属性,定位表格,提取出识别真假表格的特征信息,结合应用本体形成启发式规则,在此基础上对表格结构识别进行了分析,最后实现基于应用本体对表格数据进行抽取。
其他文献
讨论了利用间歇控制方法应用于时滞细胞神经网络的指数稳定性问题。构造适当的Lyapunov泛函,利用Halamy微分不等式得到系统全局指数稳定的时滞相关稳定条件.
随着互联网的兴起与迅速发展,现在社会中的工作、生活对互联网的依赖已经变得无法割舍。能够随时随地通过访问网络获取自己所需要的信息或者足不出户地完成工作,就需要在建筑物
企业应用集成(EAI Enterprise Application Integration)3种解决方案,即数据级集成、应用接口级集成和业务逻辑级集成中存在数据表示不统一、业务逻辑改变困难和系统间的紧耦
会议
随着网络的日益发展及应用范围的扩大,网络安全问题也越来越备受关注。本文在阐述网络安全重要性及网络安全现状的基础上,着重分析了网络安全问题存在的根本原因,提出了一个实用
随着网络和信息技术的普及,电子政务成为时代发展的必然。电子政务的安全运行是维护国家利益和安全的必然要求。安全则是确保电子政务正常运行的关键。我国应采取各种措施,加大
随着企业信息化程度的不断提高,各类应用系统同时并存并支撑着企业的业务应用。本文介绍了应用UML的概念进行商业建模,描述了在商业建模工作流中如何为新的目标组织开发一个构
将MARC数据转化为XML文档,使得MARC书目数据库和Internet上的非书目数据库的集成成为可能,从而使得现有的大量的MARC格式书目数据能方便地在数字图书馆中加以利用,使得面向WWW的
戈壁夏季气温高、气湿低、日辐射强,气候恶劣,生态环境脆弱,对部队行动和人员健康有很大影响。为了解这一特殊环境能否构成步兵负荷行军的应激源或导致其生理、心理应激,于1
为了解本县流动儿童免疫现状 ,更好地制定本县流动人口儿童预防接种管理细则 ,2 0 0 0年 9月至 10月对蒙城县各大集贸市场及流动人口聚集地的流动人口儿童免疫现状进行了调查
结合信息的定义,分析了相关信息流的度量方法,对其提出了有针对性的改进方法,以期更科学地计算信息量,作为解决信息安全问题的一种措施,从理论分析的角度进行了尝试。