【摘 要】
:
在数据挖掘、文档分类和多媒体索引等新兴领域所处理的数据集规模巨大且复杂,表现为数据集的元组数目大、属性个数多,以及属性间关系复杂.这使得数据处理变得相当困难.人们除
【机 构】
:
东北大学信息科学与工程学院,沈阳,110004
论文部分内容阅读
在数据挖掘、文档分类和多媒体索引等新兴领域所处理的数据集规模巨大且复杂,表现为数据集的元组数目大、属性个数多,以及属性间关系复杂.这使得数据处理变得相当困难.人们除了需要发现数据集中具有代表性的数据和属性,还希望进一步发现属性之间的相关性.目前,已提出了许多用于发现数据集中属性相关性的方法了改善其性能,本文定义了单基相关属性组和多基相关属性组,根据两种属性组的不同性质,可以优化搜索所有属性相关组的过程,同时还设计了一个低内存开销的高效分形维值计算方法.基于以上两点实现了快速属性相关性搜索算法FACE.算法的时间复杂度和空间复杂度都得到了降低.
其他文献
Space-time adaptive processing(STAP) has been proven to be one of the best techniques capable of detecting weak moving targets in strong clutter environment and
聚类分析是数据挖掘领域中的一项重要的研究课题,它既可以作为一个单独的工具以发现数据库中数据分布的一些深入的信息,也可以作为其他数据挖掘分析算法的一个预处理步骤.目
网格计算是分布式计算的一个新的阶段,网格需要解决在动态的虚拟组织中控制和协调对资源的共享.第一代网格的主要目的是将一些地理上分布的超级计算中心连接起来,共享这些超
2月17日凌晨,泰康人寿董事长兼CEO陈尔升站到了哈佛商学院的讲堂上,面射全球的MBA精英群体,充满激情地分享。一个来自东方的民族保险企业的成长故事。
本文以RF接口模块的后端物理设计与实现为例,使用0.18um工艺,阐述了在集成电路EDA设计工具的辅助下布局布线的具体实现方法,通过对设计结果的分析,解决了布线拥塞、时序收敛
光头、红衣、白裤,史玉柱以一成不变的装束出现。按照一贯的解读,史玉柱又要营销了。可惜不是,他脸上一直有着别样的兴奋和跃跃欲试。“我要退休!”在场所有人都愣了三五秒。
粗糙集(RoughSet,RS)理论是波兰数学家Z.Pawlak在1982年提出的一种分析数据的数学理论,是一种新的处理模糊和不确定性知识的数学工具.它已经成功地应用于诸如机器学习、数据
本文介绍了一种由动态D触发器和与非门构成的带复位功能的新型三态鉴频鉴相器.其输出有三种状态:UP为高DN为低,UP为低DN为高,UPDN同时复位为低.该鉴相器结构简单,速度快,功耗
本文介绍了低功耗SRAM中使用的字线分段技术DWL和位线分段技术DBL,分析了用于平衡全局字线连线延时的锥形局部字线驱动结构,并给出相应的优化模型.将DBL与DWL相结合,应用于一
本文设计了一种基于SIMD结构的桶形移位器,该移位器可实现32b/16bx2位算术移位、逻辑移位以及循环移位操作(分左移和右移),并兼有溢出位(overflowflag)及零标志位(zeroflag)