数据挖掘集成技术研究

来源 :计算机应用研究 | 被引量 : 8次 | 上传用户:ericxinstar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘的集成实现是目前研究的一个重要方向。从数据挖掘算法的集成及数据挖掘与其它技术的集成两个方面介绍了研究领域中的一些思想和实现的方法。其中数据挖掘方法的集成有水平集成和垂直集成两种类型。数据挖掘与其它技术(如数据库和数据仓库)的集成方式有松散方式、紧耦合和"黑箱"方式,其中,紧耦合方式是集成发展的方向。
其他文献
通过分析信息系统基本体系结构模型,探讨信息系统体系结构变化与信息系统开发技术之间的关系。从软件技术发展的三个阶段分析信息系统开发中体系结构的特征,重点讨论网络计算环境下信息系统的体系结构,认为计算机信息系统的体系结构的变化与软件技术的发展存在相互作用关系,应及时分析信息系统体系结构的发展变化,研究新的系统开发方法。
针对常见办公自动化系统智能程度低、自动化程度受到限制等问题,提出了"意见 路由支持系统"和建立在该系统基础之上的"智能办公自动化系统模型"、"智能化动态工作流参考模型"等。基于这些模型开发的办公自动化系统,不仅具备一定的智能,而且在自动化程度、柔性、通用性等方面都有所提高,开发的工作流管理系统还具有可移植性。
随着B2B电子商务特别是电子集市的发展,企业进行电子交易更加灵活、方便,但同时由于大量信息的异构性也带来了信息集成上的问题,而且这一问题已成为B2B电子商务发展的瓶颈。分析了目前B2B电子商务发展状况及出现的问题,针对性地研究了在解决这些问题时Ontology的应用,最后给出了结论。
在呼叫中心的建设中 ,为用户提供更为方便、灵活接入方式在电子商务迅速发展的今天 ,显得尤为重要。结合实际开发中的经验 ,介绍了在Internet呼叫中心平台上的一些研究成果 ,并讨论了其主要功能 (点击通话、协同浏览、实时电子邮件处理和文本交谈 )和实现方法
将分布式人工智能中的智能Agent用于计算机网络管理 ,是近年来最活跃最前沿的研究领域之一。介绍Agent和多Agent系统 (MAS)以及主动网络的概念 ,从分布式主动网络管理体系结构入手 ,论述了基于多A gent的主动网络管理模型 ,研究了主动网络管理智能Agent以及MAS体系结构。
数据网格为数据密集型的应用提供了强有力的支持,数据服务是数据网格的核心,因而数据请求代理(DRB)服务器的设计是实现数据服务的关键。一个结构、性能较好的服务器能屏蔽数据的广域分布性和异构性,实现一体化数据访问、存储、传输与管理。基于Cluster实现了一种数据请求代理服务器,这种服务器实现了上述目标,并具有许多优点,特别在具有多Cluster的高性能计算中,可以同时建立多个连接进行数据分块传输,能
怎样存储海量的生物数据以及如何使得它们更为方便地被生物学家利用已成为当前生物领域亟待解决的问题。国外曾出现了诸如GenBank,Swiss Prot,KEGG等生物数据库,但是由于它们各自的数据库标准不同,这给生物学家的查询和研究工作带来极大地不便。描述一个基于这些异构数据库的整合的数据仓库系统,并在此基础上开发了一个语义相似性查询工具,实现智能化的多重、复合和交叉检索。
针对当前工作流管理系统负载平衡能力差,不能满足大批量调度的问题,提出了一个自注册的分布式工作流管理系统。该系统由一个引擎代理来实现动态记录工作流引擎当前负载信息,能够在工作流引擎间合理分配负载量,实现流程实例的优先级调度,支持引擎的预定义最大负载量。通过实际应用和测试结果表明,该系统能较好地实现工作流管理系统的负载平衡。
随着目前数据库技术与GIS应用的结合,采用对象关系数据库来管理空间数据已表现出强大的生命力。空间数据的更新处理,在解决空间数据共享和空间数据的互操作性方面有着重要的意义。在基于对象关系数据库管理空间数据的基础上,设计了一种分布式空间数据的异步更新模型,从而可以较好地应用于对移动式分布空间数据的更新信息处理。
阐述了一个中英文专业Web搜索引擎数据采集加工的通用设计与实现方法,并着重介绍了具体实现中一些关键技术问题的处理(以Java为例)。