半结构化数据中模式的交互式开采

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:guoaiet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的迅速发展和日益成熟,人们积聚了越来越多的半结构化数据,如HTML,SGML,XML等文件。本文研究了半结构化数据中模式的交互式开采问题并且给出了相应的开采算法,实验结果表明该算法性能是高效的。
其他文献
搜索引擎是一种用于帮助Internet用户查询信息的搜索工具,它根据一定的策略在Internet中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信
会议
Web已成为人们获取信息的一个重要途径,由于Web信息的日益增长,人们不得不花费大量的时间去搜索浏览自己需要的信息.为了减轻这个困难,人们开发了许多工具来辅助寻找期望的信
会议
随着我国产业结构调整和优化升级,租格寄售这种新型的商业模式所展现出来的社会效益和经济效益是不可估量,寄售实体店内化妆品销售占据较大份额,成为化妆品流通的又一新兴业
数据仓库系统的特点主要是数据量大、要求查询速度快,用户的查询只关心综合数据,而很少关心细节数据.并行数据仓库系统的存储管理与以往的并行系统存在着很大的差异。由于数
会议
随着万维网的日益普及与强大,在网络上搜寻所需的信息变得越来越重要了.诸如AltaVista,Hotbot之类的搜索引擎应运而生.典型的搜索引擎是基于文本匹配的,针对用户的查询会返回
会议
随着新经济时代的到来,信息爆炸使得存储的扩容和升级已经远远超出了处理器和网络的升级速度.UCBerkeley的信息管理学院最新研究成果显示:全球每年产生15亿GB的信息,平均250M
Wrapper是Web数据集成的重要组成部分,然而众多的Wrapper生成方法都面临着维护的问题,因为Web页面经常发生变化,Wrapper的维护成为一项很难解决的问题.人们研究快速有效地自
会议
Peer-to-Peer(P2P)技术也被称为Peer计算,是当前最有潜力的网络技术之一.这种技术去除了集中式服务器,使节点之间可以直接交换资源和服务.同时,任何一个节点可以自由地加入和
本文使用语义近似度分析了集成信息的GV中数据项的语义原子性与关系数据源中数据项的结构原子性之间的各种映射关系,阐述了二者不一致性的产生原因以及解决途径,对集成信息的产
本文提出了一种自动从XML数据文件抽取其数据模式的算法。从实验结果和理论分析两个方面与Lore系统(斯坦福大学的XML数据库系统)中的DataGuides相比,表明本算法有更高的效率.