数据抽取相关论文
油田开发过程中积累了数量可观的文档、报表、图件等非结构化数据资源,是各项业务研究的基础资料,也是实施结构化数据治理的重要依......
文书搜索是政法大数据管理的重要功能之一。文书搜索子平台面向政法部门,旨在帮助用户快速查阅文书。通过阅读文书,用户可以学习文......
农业是我国的支柱产业,构建安全、可信、稳定、可溯源、信息共享、大吞吐量的农业供应链系统是实现我国农业信息化的必经之路。然......
随着互联网技术的高速进步,传统工业领域应用互联网技术的情况越来越普遍。工业系统中数据的重要性不言而喻,而传统行业中的企业在......
介绍数据仓库的基本理论以及应用的关键技术,并以武钢国贸数据集市的建立为例,介绍数据集市设计和实施的过程,总结建设过程中遇到的问......
数据库同步是不同安全区域应用中必不可少的、最重要的环节。数据库同步包括数据的抽取(Extract)和装载(Load)两个过程。电能量采......
随着大数据时代来临,数据已经成为企业发展的要素之一.通过构建数据仓库,能够为企业决策的制定提供所有类型数据支持.在搭建邮政企......
日益广泛应用的动态页面使数据抽取成为信息检索的关键技术和垂直搜索等领域中的重要组成部分.页面聚类利用页面间相互关系,可有效......
数据对于地球科学研究非常重要,很多高质量的数据来自于公开出版的学术论文,利用这些数据需要将文献中的文本抽取为结构化的数据,......
医院绩效管理系统是现代医院管理的重要方法和科学的管理工具,因医院业务复杂,涉及业务系统多且建设时间不一,数据库平台不统一。......
当今社会,互联网技术迅猛发展,各种信息发布方式和渠道都在不断地变化,同时,社会关注的焦点也在实时发生变化,互联网信息监督管理......
文章在分析数字图书馆数据库统一检索技术与应用现状的基础上,介绍了Ontology(本体)概念,构建了两类数据库与Ontology的集成与映射......
时间:1992年10月30日至11月1日地点:清华大学议题:①应用;②认知科学;③神经网络;④语言识别;⑤计算机视觉;⑥数据抽取与传感技术......
WANFANG Academic Search System(WFASS)产品简介万方学术搜索系统加工整理了用户拥有的国内外主要学术文献题录数据资源,构成覆盖......
在会议文献开放资源采集与服务系统中实现了自动抽取+人工校对的元数据抽取流程,并设计了一个自动抽取器。针对会议文献开放资源本......
在简单介绍煤炭企业数据仓库系统产生的背景基础上,提出了构建煤炭企业数据仓库系统的框图结构。详细分析了实施时需采用的主要技......
本文从ETL技术在广州地铁清算系统数据仓库的应用概况出发,首先,分析了应用中存在的数据抽取失败、作业配置不合理、数据核对过......
随着国内物流业的快速发展,物流信息化建设不断深入,企业中信息子系统不断增多,形成一个个的“信息孤岛”,构建信息集成平台,可以使企业......
随着企业信息化的发展,企业纷纷新建商业智能系统进行数据分析和辅助决策。而数据的异构导致了系统实施、数据整合的困难,解决异构数......
近十几年来,随着互联网的快速普及与发展,网上的应用越来越丰富,信息量更是呈指数级、爆炸式增长。互联网已经日益成为了人们获取信息......
保险行业需要利用数据仓库技术提高信息化水平,通过数据仓库来管理和运用好自己的数据,建立决策支持系统,从而增强企业的竞争力。保险......
当今社会正迈入知识经济时代.随着信息技术的高速发展,信息资源对于企业的经济价值和社会价值所起的作用越来越明显,而数据仓库技......
该文旨在研究基于异构数据源的数据仓库系统开发平台的构建技术,并在Intranet环境下设计和实现了一个数据仓库系统框架,该框架具有......
论文提出了一种新的文本文件结构化数据提取技术,我们称之为TSDE(Text Structured Data Extracting),它是一个交互式的文件结构及数......
数据仓库是用来支持决策分析处理的、面向主题的、集成的、不可更新的、随着时间不断变化的数据集合.企业应用的强烈需求是促使数......
预测和订货管理是依赖于信息的两大物流工作,直接关系到存货管理和生产、销售支持.对于采购决策数据的通用表达可以引入采购增值网......
本文介绍了基于XML的宝钢物资采购网络方案,着重讨论该方案中的三个关键问题:采购决策时,异构数据源数据内容的抽取和其XML表达;不......
工作流技术作为一种实现企业过程集成的有效手段,正被越来越多的行业所关注,成为企业业务过程建模、业务过程仿真分析、业务过程优......
Internet的迅速发展使得网络上的信息量大大增加,为用户提供了一个极具价值的信息源,但因Internet所固有的开放性、动态性与异构性,又......
数字图书馆作为第二代Internet的关键基础设施,近年来取得了快速的发展。面对海量的、异构的数字资源仓储,帮助用户准确有效地找到所......
伴随着企业信息化建设的不断推进以及信息化程度的不断提高,各种应用系统集成的需求越来越大。应用集成首先要面对的问题就是数据集......
随着Web的迅速发展和普及,可以获取信息的种类和结构日益丰富,从传统关系数据库到分布于Web上的大量半结构化信息,以及日益增多的Hidd......
随着网络技术的发展与存储技术的提高,相似文本大量存在的现象越来越常见。将大规模数据中的相似文档检测出来,对于网络镜像,数据抽取......
ETL过程是一个从分布数据源(包括数据库、应用系统、文件系统等)抽取数据,进行转换、集成和传输,并最终加载到目标系统的过程。传统......
在充分吸收国内外数据集成领域研究成果的基础上,通过分析分布式对象技术、Agent技术和XML技术,提出了一个以多数据库系统为主要技......
在分析综合分布式对象技术、多数据库技术和XML技术的基础上,给出了一种分布异构数据源的集成方法.该方法以多数据库系统作为其技......
数据仓库是数据挖掘和决策分析的基础,纠正数据错误是避免错误决策、降低决策风险的重要一环.因此,数据仓库需要高质量的数据.完成......
最近10年来网络技术取得了突飞猛进的发展,无论从网络通讯的基础设施,还是到基于Internet的全局计算模型的研究和应用,对人们进行信息......
在计算机科学领域,数据仓库技术代表了计算机技术一个重要的发展方向,与其相关的研究工作引起了人们广泛的关注和重视。数据仓库技......
随着信息时代的到来,企业在发展过程中,积累了大量纷杂数据,如何利用这些数据来指导企业决策分析,是企业能否在竞争中取得经济效益......
电子病历文本中的时间信息,对于标识患者从入院到出院期间不同阶段的病情变化,有着不可替代的作用,因而时间信息抽取在医学领域中受到......
本文探讨了目前几种成熟的技术,如:Web爬虫、Web数据抽取、Web服务等,然后将它们整合后设计出一套针对软件更新管理的应用系统。本文......
近几年,信贷风险已渗透到银行的每一信贷经营之中,严重影响到银行的生存和发展。出于控制信贷风险等业务上的紧迫需求,建设银行开发出......
近年来互联网正强有力的改变着世界。信息革命不仅极大地改变了人们的生活方式,而且带来了巨大的社会变革。互联网成了一个巨大的......