【摘 要】
:
分析了现有的对Apriori算法的改进方向,新算法将Apriori的剪枝步骤合并入从Lk-1与Lk-1连接生成Ck的连接步骤,通过使用临时项集TQ存储Lk-1中单个数据项集与Lk-1中其他数据项集连接的结果,从而将被扫描集合的大小从Lk-1缩减为L1的大小,极大地提高了Ck的生成效率。
【机 构】
:
TATA信息技术有限公司,UT斯达康通信有限公司
论文部分内容阅读
分析了现有的对Apriori算法的改进方向,新算法将Apriori的剪枝步骤合并入从Lk-1与Lk-1连接生成Ck的连接步骤,通过使用临时项集TQ存储Lk-1中单个数据项集与Lk-1中其他数据项集连接的结果,从而将被扫描集合的大小从Lk-1缩减为L1的大小,极大地提高了Ck的生成效率。
其他文献
数据网格为数据密集型的应用提供了强有力的支持,数据服务是数据网格的核心,因而数据请求代理(DRB)服务器的设计是实现数据服务的关键。一个结构、性能较好的服务器能屏蔽数据的广域分布性和异构性,实现一体化数据访问、存储、传输与管理。基于Cluster实现了一种数据请求代理服务器,这种服务器实现了上述目标,并具有许多优点,特别在具有多Cluster的高性能计算中,可以同时建立多个连接进行数据分块传输,能
怎样存储海量的生物数据以及如何使得它们更为方便地被生物学家利用已成为当前生物领域亟待解决的问题。国外曾出现了诸如GenBank,Swiss Prot,KEGG等生物数据库,但是由于它们各自的数据库标准不同,这给生物学家的查询和研究工作带来极大地不便。描述一个基于这些异构数据库的整合的数据仓库系统,并在此基础上开发了一个语义相似性查询工具,实现智能化的多重、复合和交叉检索。
针对当前工作流管理系统负载平衡能力差,不能满足大批量调度的问题,提出了一个自注册的分布式工作流管理系统。该系统由一个引擎代理来实现动态记录工作流引擎当前负载信息,能够在工作流引擎间合理分配负载量,实现流程实例的优先级调度,支持引擎的预定义最大负载量。通过实际应用和测试结果表明,该系统能较好地实现工作流管理系统的负载平衡。
随着目前数据库技术与GIS应用的结合,采用对象关系数据库来管理空间数据已表现出强大的生命力。空间数据的更新处理,在解决空间数据共享和空间数据的互操作性方面有着重要的意义。在基于对象关系数据库管理空间数据的基础上,设计了一种分布式空间数据的异步更新模型,从而可以较好地应用于对移动式分布空间数据的更新信息处理。
阐述了一个中英文专业Web搜索引擎数据采集加工的通用设计与实现方法,并着重介绍了具体实现中一些关键技术问题的处理(以Java为例)。
数据挖掘的集成实现是目前研究的一个重要方向。从数据挖掘算法的集成及数据挖掘与其它技术的集成两个方面介绍了研究领域中的一些思想和实现的方法。其中数据挖掘方法的集成有水平集成和垂直集成两种类型。数据挖掘与其它技术(如数据库和数据仓库)的集成方式有松散方式、紧耦合和"黑箱"方式,其中,紧耦合方式是集成发展的方向。
针对运动物体二维模拟中多重嵌套运动建模的复杂性,讨论了如何应用二维坐标系相对性原理来分解复杂的非线性运动为多个简单的线性和非线性运动的迭加,并且利用面向对象方法学中的类、对象及其相互关系来反映这种"非线性"和"线性"之间的关系,使运动物体的二维模拟变得更加简单明了。
首先将真彩色图像转换为灰度图像,通过傅里叶正变换后将所有像素点的幅值设定为一常数,进行傅里叶逆变换,得到像素点的新灰度值;然后将每点灰度值倒置求反,再对图像进行锐化和平滑等处理来实现图像的素描效果。实验结果证明:该算法快速有效,生成的素描图像既能进行图像识别,提高图像质量,又可以达到美术和艺术效果,具有较高的理论和应用价值。
因特网对大多数组织机构而言,都是最大的外部数据库。如何把Web数据集成并入组织机构的数据仓库为之所用,是一个有实际意义的新课题。介绍了Web集成(WebIntegration,WI)这种系统化的方法,使用它可把Web数据并入数据仓库从而改善组织机构的决策制定过程,并提出了WI面临的问题,展望了WI的未来。
简单介绍了本体模型 ,XML ,XMLSchema ,OIL ,分析了OIL与XMLSchema的关系 ,并通过实例着重讨论了从知识框架到OIL ,最后以XMLSchema作为最终知识体的过程