数据抽取相关论文
油田开发过程中积累了数量可观的文档、报表、图件等非结构化数据资源,是各项业务研究的基础资料,也是实施结构化数据治理的重要依......
文书搜索是政法大数据管理的重要功能之一。文书搜索子平台面向政法部门,旨在帮助用户快速查阅文书。通过阅读文书,用户可以学习文......
农业是我国的支柱产业,构建安全、可信、稳定、可溯源、信息共享、大吞吐量的农业供应链系统是实现我国农业信息化的必经之路。然......
随着互联网技术的高速进步,传统工业领域应用互联网技术的情况越来越普遍。工业系统中数据的重要性不言而喻,而传统行业中的企业在......
当今社会,互联网技术迅猛发展,各种信息发布方式和渠道都在不断地变化,同时,社会关注的焦点也在实时发生变化,互联网信息监督管理......
随着国内物流业的快速发展,物流信息化建设不断深入,企业中信息子系统不断增多,形成一个个的“信息孤岛”,构建信息集成平台,可以使企业......
随着企业信息化的发展,企业纷纷新建商业智能系统进行数据分析和辅助决策。而数据的异构导致了系统实施、数据整合的困难,解决异构数......
近十几年来,随着互联网的快速普及与发展,网上的应用越来越丰富,信息量更是呈指数级、爆炸式增长。互联网已经日益成为了人们获取信息......
Internet的迅速发展使得网络上的信息量大大增加,为用户提供了一个极具价值的信息源,但因Internet所固有的开放性、动态性与异构性,又......
网络信息集成涉及多种不同类型的异构信息源,如:HTML、XML、关系数据库等.其目标是设计出一种高度灵活而综合的集成方法.来对这些......
在充分吸收国内外数据集成领域研究成果的基础上,通过分析分布式对象技术、Agent技术和XML技术,提出了一个以多数据库系统为主要技......
在分析综合分布式对象技术、多数据库技术和XML技术的基础上,给出了一种分布异构数据源的集成方法.该方法以多数据库系统作为其技......
数据仓库是数据挖掘和决策分析的基础,纠正数据错误是避免错误决策、降低决策风险的重要一环.因此,数据仓库需要高质量的数据.完成......
最近10年来网络技术取得了突飞猛进的发展,无论从网络通讯的基础设施,还是到基于Internet的全局计算模型的研究和应用,对人们进行信息......
在计算机科学领域,数据仓库技术代表了计算机技术一个重要的发展方向,与其相关的研究工作引起了人们广泛的关注和重视。数据仓库技......
随着信息时代的到来,企业在发展过程中,积累了大量纷杂数据,如何利用这些数据来指导企业决策分析,是企业能否在竞争中取得经济效益......
本文探讨了目前几种成熟的技术,如:Web爬虫、Web数据抽取、Web服务等,然后将它们整合后设计出一套针对软件更新管理的应用系统。本文......
近年来互联网正强有力的改变着世界。信息革命不仅极大地改变了人们的生活方式,而且带来了巨大的社会变革。互联网成了一个巨大的......
本文从元数据的获取和维护的角度出发,对数据抽取和更新中存在的问题进行了研究,最后给出了系统实现。主要研究成果如下: (1)研究......
Internet的飞速发展以及它开放式的特点使得网上的信息不断的膨胀,Web已成为人们不可缺少的信息源。Web中存在着大量的描述实体间......
本文讨论了XML较其它半结构化模型的优势,以及现有的基于XML的Web数据抽取技术,考虑到HTML页面的特点,引入了采用基本项方式描述......
目前的互联网已经发展成为拥有上亿用户和几百万个站点的巨大的分布式信息空间,而且其信息量仍在飞速增加,因此查询网上信息变得日益......
伴随着神奇的“啤酒搭着尿布卖”的故事,数据仓库走进了中国人的视野。“啤酒搭着尿布卖”是一个经典的关于数据挖掘的故事,它告诉......
知识经济条件下,知识更新速度加快,科学技术发展迅猛,科研评估体系出现了新的发展动向。在科研评估体系中,数据的处理在其中占有重要的......
商务智能是计算机在大型企业商务中应用的一个新兴的领域。商务智能的任务是使用各种人工智能算法(如聚类、关联规则、分类等)对企......
数据仓库技术为决策分析提供了更好的支持,跳出了传统联机事务处理的范畴,是数据处理的发展方向,并在各个行业都得到了很多的应用。 ......
建立数据仓库时,集成的数据是进一步分析、统计和数据挖掘的基础。另外,数据仓库中的数据必须是共享、可重用的,而不是造成了新的信息......
ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)就是负责从多个数据源抽取,转换并装载数据到数据仓库的过程,它是......
彩铃业务是“个性化多彩回铃音业务”(Color Ring Back Tone)的简称,是一项由被叫用户定制,为主叫用户提供一段悦耳的音乐或一句问候......
本文是一个数据仓库工程项目,文中集中讨论了一个气象数据仓库的设计和实现过程。本文的数据仓库设计和实现都基于ORACLE 10g的数据......
商务智能(Business Intelligence,BI)帮助企业实现从数据到信息、从信息到知识、从知识到利润地转化。传统商务智能系统是在原有业......
随着Internet的发展和Web上信息的快速增加,人们越来越多地依赖搜索引擎来查找所需信息。目前的主流搜索引擎主要依靠爬虫爬行网页......
Deep Web是指那些存储在Web数据库里、不能通过超链接访问而需要采用动态网页技术访问的资源集合。随着Web数据库的不断增长,通过......
在Internet的飞速发展和普及下,丰富的Web资源构成了一个巨大的全球性信息仓库,网络已经成为人们获取信息的一个重要手段。面对庞......
移动计算设备实施远程教学即M_Learning,M_Learning模式的远程教育则给用户提供真正的随时随地、个性化学习、开放式学习。移动学......
学位
随着互联网和信息技术在各个领域的深入应用,存储在各个信息系统中的信息大量增加。一方面,这些信息分布广泛、管理自治和异构性强的......
随着在线结构化数据库的出现,与日俱增的要求大规模的信息集成,对于不同的领域,网络上存在着大量的并且不断更新的数据资源。那么,......
作为在信息检索领域的一个研究热点,Web数据抽取技术已经日益被众多大学和研究机构作为研究重点。Web数据抽取亦称Web信息采集(Web......
随着计算机和网络技术的快速发展,互联网在人们的日常生活中发挥着越来越重要的作用。信息检索作为互联网应用的重要组成部分,是用......
随着Internet及其相关技术的飞速发展,互联网已成为最大的信息源。无论对于企业还是个人,Web逐渐成为最主要的信息来源。目前,90%......
随着万维网技术和数据库技术的结合,网络开始迅速的深化。大量的信息都隐藏在Web数据库中,用户通过查询可以动态的获取这些信息,学......
Web数据库根据用户提交的请求,将其内容以HTML页面的形式动态呈现出来,这些信息称之为Deep Web资源。而HTML语言的特点是在Web上发......
Deep Web是不能被搜索引擎检索到的网络中的资源。Deep Web中包含的信息量比Surface Web中大了几个数量级,并且随着Deep Web中的数......
本论文先介绍了数据仓库的相关理论、ETL(数据抽取、转换和装载)技术、OLAP(联机分析处理)与数据挖掘相关概念及其与数据仓库的关......