论文部分内容阅读
进入70年代后,在社会大系统中出现了巨大的信息流和与之相伴的宏大的数据流,为了适应和满足社会发展的需要,必须采用新的技术和手段来对这些数据进行收集、存储、加工、检索、分类、统计和传输等,于是数据库技术不可避免地产生了。由于计算机被广泛地应用于数据管理领域以及互联网的迅速普及,人们对数据共享和联机实时处理的要求也越来越高,于是数据库技术又在不断地发展改进。
WWW网络环境下Web数据库
由于Web的易用性、实用性,它很快占据了主导地位,目前已经成为使用最为广泛、最有前途、最有魅力的信息传播技术。不过,Web服务只是提供了Internet上信息交互的平台,要想实现真正的Internet,就要将人、企业、社会与Internet融为一体,这就要靠信息化应用的实现。电子商务是以Web网络技术和数据库技术为支撑的,其中Web数据库技术是电子商务的核心技术。支持电子商务已经成为各大厂商竞争的焦点,Web数据库的发展成为新的热点和难题。Web数据库,就是能将数据库技术与Web技术很好地融合在一起,使数据库系统成为Web的重要有机组成部分的数据库,能够实现数据库与网络技术的无缝有机结合。
目前,关系数据库的应用范围最广,占据了数据库主流地位。关系数据库最初设计为基于主机/终端方式的大型机上的应用,其应用范围较为有限,随着客户机/服务器方式的流行和应用向客户机方的分解,关系数据库又经历了客户机/服务器时代,并获得了极大的发展。随着Internet应用的普及,由于Internet上信息资源的复杂性和不规范性,关系数据库初期在开发各种网上应用时显得力不从心,表现在无法管理各种网上的复杂的文档型和多媒体型数据资源,后来关系数据库对于这些需求作出了一些适应性调整,如增加数据库的面向对象成分以增加处理多种复杂数据类型的能力,增加各种中间件(主要包括CGI、ISAPI、ODBC、JDBC、ASP等技术)以扩展基于Internet应用能力,通过应用服务器解释执行各种HTML中嵌入脚本来解决Internet应用中数据库数据的显示、维护、输出以及到HTML的格式转换等。此时关系数据库的基于Internet应用的模式典型表现为一种三层或四层的多层结构。在这种多层结构体系下,关系数据库解决了数据库的Internet应用的方法问题,使得基于关系数据库能够开发各种网上数据库数据的发布、检索、维护、数据管理等一般性应用。
但是我们可以说关系数据库从设计之初并没有也不可能考虑到以HTTP为基础、HTML为文件格式的互联网的需求,只是在互联网出现后才作出相应的调整。同时,关系数据库的基于中间件的解决方案又给Internet应用带来了新的网络瓶颈,应用服务器端由于与数据库频繁交互,因其本身的效率和数据库检索的效率造成Internet应用在应用服务器端的阻塞。
虽然关系型数据库具有完备的理论基础、简洁的数据模型、透明的查询语言和方便的操作方法等优点,但是由于它本身并没有针对网络的特点和要求进行设计,因此并不适用于网络环境,我们应该研究开发新的数据库技术,从开始就考虑到Web的信息和结构特点,使数据库真正能与Web融合为一体,充分利用二者的特点,建立合理的Web数据库。
Web数据库的发展趋势
1.非结构化数据库
在信息社会,信息可以划分为两大类。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。结构化数据属于非结构化数据,是非结构化数据的特例。
随着网络技术的发展,特别是Internet和Intranet技术的飞快发展,使得非结构化数据的数量日趋增大。这时,主要用于管理结构化数据的关系数据库的局限性暴露地越来越明显。因而,数据库技术相应地进入了“后关系数据库时代”,发展进入基于网络应用的非结构化数据库时代。所谓非结构化数据库,是指数据库的变长纪录由若干不可重复和可重复的字段组成,而每个字段又可由若干不可重复和可重复的子字段组成。简单地说,非结构化数据库就是字段可变的数据库。
我国非结构化数据库以北京国信贝斯(iBase)软件有限公司的iBase数据库为代表。IBase数据库是一种面向最终用户的非结构化数据库,在处理非结构化信息、全文信息、多媒体信息和海量信息等领域以及Internet/Intranet应用上处于国际先进水平,在非结构化数据的管理和全文检索方面获得突破。它主要有以下几个优点:
(1)Internet应用中,存在大量的复杂数据类型,iBase通过其外部文件数据类型,可以管理各种文档信息、多媒体信息,并且对于各种具有检索意义的文档信息资源,如HTML、DOC、RTF、TXT等还提供了强大的全文检索能力。
(2)它采用子字段、多值字段以及变长字段的机制,允许创建许多不同类型的非结构化的或任意格式的字段,从而突破了关系数据库非常严格的表结构,使得非结构化数据得以存储和管理。
(3)iBase将非结构化和结构化数据都定义为资源,使得非结构数据库的基本元素就是资源本身,而数据库中的资源可以同时包含结构化和非结构化的信息。所以,非结构化数据库能够存储和管理各种各样的非结构化数据,实现了数据库系统数据管理到内容管理的转化。
(4)iBase采用了面向对象的基石,将企业业务数据和商业逻辑紧密结合在一起,特别适合于表达复杂的数据对象和多媒体对象。
(5)iBase是适应Internet发展的需要而产生的数据库,它基于Web是一个广域网的海量数据库的思想,提供一个网上资源管理系统iBase Web,将网络服务器(WebServer)和数据库服务器(Database Server)直接集成为一个整体,使数据库系统和数据库技术成为Web的一个重要有机组成部分,突破了数据库仅充当Web体系后台角色的局限,实现数据库和Web的有机无缝组合,从而为在Internet/Intranet上进行信息管理乃至开展电子商务应用开辟了更为广阔的领域。
(6)iBase全面兼容各种大中小型的数据库,对传统关系数据库,如Oracle、Sybase、SQLServer、DB2、Informix等提供导入和链接的支持能力。
通过从上面的分析后我们可以预言,随着网络技术和网络应用技术的飞快发展,完全基于Internet应用的非结构化数据库将成为继层次数据库、网状数据库和关系数据库之后的又一重点、热点技术。
2.异构数据库系统
由于历史等原因,Internet上的数据库系统不少是分布、异构的。Internet上大量信息必须通过数据库系统才能有效管理。那么,Internet环境下分布式海量信息情况下如何建立合理高效的海量数据库,成为我们亟待解决的问题。针对目前关系型数据库占据了绝大多数市场的情况,要实现网络环境下的海量信息共享,就必须联合各个异构数据库,使得数据库之间能够通过主动式的超文本链接,实现相互连接,使得交叉引用的数据可以被很容易地检索到。
相互关联的数据库可以很容易地被归纳在一起、创建一个单一的虚拟数据库,也叫做异构数据库系统。异构数据库系统是相关的多个数据库系统的集合,可以实现数据的共享和透明访问,每个数据库系统在加入异构数据库系统之前本身就已存在,拥有自己的DBMS。它的异构性主要体现在以下几个方面:计算机体系结构的异构;基础操作系统的异构;DBMS本身的异构。它的目标在于实现不同数据库之间的数据信息资源、硬件设备资源和人力资源的合并和共享。
公司企业在Internet环境下实现电子商务,它的实际应用环境非常复杂,他们可能分布在不同的地理位置,使用不同的数据组织形式和操作系统平台,加上应用不同所造成的数据不一致性问题,如何将这些高度分布的数据集中起来充分利用成为亟待解决的问题。建立在异构数据库系统基础上的数据仓库技术便产生了。“数据仓库是20世纪90年代信息技术构架的新焦点,它提供集成化和历史化的数据,集成种类不同的应用系统,数据仓库从事物发展和历史的角度来组织和存储数据,以供信息化和分析处理之用。它是集成的、以主题为向导的、不可更新的、随时间不断变化的数据集合。”数据仓库可以从异构数据库系统中的多个数据库,并建立统一的全局模式,同时收集的数据还支持对历史数据的访问,用户通过数据仓库提供的统一的数据接口进行决策支持的查询。在数据仓库的基础上,又可以进行数据挖掘、Web挖掘,实现真正地信息检索查询。
目前,异构数据库系统的集成以及建立此基础之上的数据仓库、数据挖掘已经成为网络数据库技术研究的重点之一。著名的国内外数据库厂商也将异构数据库系统作为竞争的焦点,研究如何将原来传统的、可能分布于各地的多个关系数据库集成起来,进行改进和发展,形成虚拟异构数据库系统和数据仓库,更好地企业信息化、电子商务服务。
结 束 语
最近几年,我国的数据库市场飞速发展,并将具有更为巨大的增长潜力。首先,在近几年里,电子商务成为各个公司企业发展的重心,甚至有人预言,电子商务极有可能建立起新型的虚拟商业,乃至虚拟工业。而电子商务是以数据库技术和网络技术为支撑的,其中数据库技术是其核心。其次,有更多的用户把数据库的重要性放在十分重要的地位,其主要原因是用户将把应用软件和应用需求放在首位,而应用软件开发直接依赖于数据库开发工具。还有一个原因是硬件随着芯片技术的发展越来越缺乏特性,硬件指标将变成次要的考虑因素。对行业性应用来讲,而今可能是首选数据库厂家再考虑硬件厂家了。正是用户需求的这种变化给数据库厂商提供了新的发展机会。所以可以预言,在不久的将来Web数据库将成为数据库领域研究的热点技术。