一种基于单调递减阈值函数的高维数据集聚类算法

来源 :第二十二届中国数据库学术会议 | 被引量 : 0次 | 上传用户:fly884531973
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域中的一项重要的研究课题,它既可以作为一个单独的工具以发现数据库中数据分布的一些深入的信息,也可以作为其他数据挖掘分析算法的一个预处理步骤.目前,高维数据集的高效聚类已成为聚类分析算法的巨大挑战.迄今为止,国内外的研究者已经提出了许多聚类算法,在本文中提出了一种基于最优分割区间和单调递减阈值函数的子空间聚类算法FIS.它在保证精度的同时能够有效改善聚类算法对于存在高维聚类的执行效率.从实验中可以看出,FIS算法是有效的.但同时也应该看到,FIS算法还是不能从根本上克服"维数灾难",这也是值得今后进一步深入研究的子空间聚类挖掘算法的一个关键技术.
其他文献
本文的研究目的就是应用软件工程方法对安全控制机制与数据库开发技术相结合的途径进行研究,提出一个安全扩展的ER模型(SEER模型),并在此基础上研制一个安全数据库系统开发工
失控悬转三年半的命运罗盘终于停下,停在8月7日这一天.因“逃避追缴所欠税款”被判入狱四年的兰世立因“病残”提前3个月出狱,走到了人生新的转折点.rn更大的转折出现在20天
中国能源需求仍然是国际能源市场增长的决定性因素之一美国经济快速复苏,能源领域变革尤其是页岩气革命扮演了极其重要的角色。中国新一轮改革开放,能源政策、能源市场、能源
根据国家广电总局《有线广播电视网实施细则》要求,江苏有线南京分公司有线数字电视前端系统通过近几年的努力,对有线数字电视前端信源接收、信号处理、调制传输、安全播出监
随着网络和数据库技术的不断发展,以及各类数据的飞速膨胀,大规模的分布式数据库系统逐渐被广泛应用.海量的数据被分散存储在地理位置不相同的局部数据库中,数据拥有者们通过
会议
双十一已经结束,可很多人还意犹未尽.一张马云在银泰门店购物,30秒钟刷掉39元的照片在网络间又被广泛传播.与双十一不同的是,这一次的主角其实不是马云,而是照片边上站在一旁
近年来,数据挖掘技术逐渐成为了计算机应用领域中的最为活跃的研究热点之一.与此同时,随着企业的市场竞争的日趋激烈和业务环境的不断变化,企业数据中的时间信息的管理问题成
会议
关联规则具有多种类型,其中包括数值型关联规则,其基本思想是将数值型属性进行离散化,从而将问题转换为类别型关联规则挖掘问题.但是数值型属性离散化存在着锐利边界值问题,
会议
CE:为什么要从外面找人来接替你在汇源果汁CEO的职位?朱新礼:一开始想内部培养,后来发现内部培养的人对你很忠诚,但也会很依赖你,这个跟我的需求之间还是有差距。汇源发展了20多
Space-time adaptive processing(STAP) has been proven to be one of the best techniques capable of detecting weak moving targets in strong clutter environment and