【摘 要】
:
在很多领域中,由于数据挖掘的数据集通常有较高的维度.现有大多数聚类算法在较低维度虽然效果很好,但是,维度较高时,性能就会大打折扣,因为它们的复杂度随着维度的增加而成指数级增长.为了解决这个问题,我们提出了一个用于高维数据聚类的通用框架模型.一般常用的聚类算法,与该模型结合之后,就能够有效地用于高维数据的聚类分析.在该模型中,把高维聚类分解成若干个一维聚类或者二维聚类.每个阶段只考虑其中一个维度或者
【出 处】
:
中国计算机学会网络与数据通信学术会议
论文部分内容阅读
在很多领域中,由于数据挖掘的数据集通常有较高的维度.现有大多数聚类算法在较低维度虽然效果很好,但是,维度较高时,性能就会大打折扣,因为它们的复杂度随着维度的增加而成指数级增长.为了解决这个问题,我们提出了一个用于高维数据聚类的通用框架模型.一般常用的聚类算法,与该模型结合之后,就能够有效地用于高维数据的聚类分析.在该模型中,把高维聚类分解成若干个一维聚类或者二维聚类.每个阶段只考虑其中一个维度或者两个维度.经过多个阶段的聚类,来实现高维数据的聚类分析.这样,普通的低维聚类算法就能够用来处理高维数据集.此外,由于在每一次聚类过程中只考虑其中一个维度或两个维度,那么不同类型的属性就可以用不同的聚类算法来处理,从而对混合型的数据集也能够很好地进行聚类分析.最后,我们通过实验对该模型进行了验证.
其他文献
本文在简述NFS的基础上,结合远程资源的存取,详细介绍了访问资源的两种方法:mount和automonut,深入探讨了两者的使用,分析了两者的利弊,给出了server端只允许某一个或某几个用户访问存取资源的实例及发生资源死锁造成系统引导失败故障的解决方法.
本文介绍了一种无线网络接口卡的核心硬件模块的实现原理,并对其接收模块和发送模块的硬件实现电路作出分析.
本文主要介绍了基于CORBA的远程教育支撑平台中视频部分的体系结构,详细讨论了视频在各个层次的具体实现,指出了基于CORBA系统构建网络多媒体服务的合理性.
文章分析了传统的软件agent平台消息传输机制及其不足,结合当前楼宇自控网络通信技术的发展,提出了一种新的基于BACnet(Building Automation and Control Networks)控制网络协议的agent消息传输方法,Agent平台通过对BACnet标准中文件对象及其相关服务的引用实现了不同agent平台间消息的相互传递.从而为将软件agent技术引入楼宇自控系统提供了一
燕捷多服务器文件存贮系统是由北京大学计算机系网络与分布式系统实验室开发的一种可靠的、高效的、易于使用的网络存贮系统.本文将分析该系统的主动备份与冗余淘汰机制与算法,并由此推论出该系统的用户容量.
为了在工业控制网络中应用传统的以太网(Ethernet)技术,必须改善网络结构的健壮性,保证信号传输的实时性要求.本文讨论了工业控制网络拓扑结构的冗余容错设计、Switched Ethernet(交换以太网)中涉及QoS实时性要求的两种等待队列和调度算法问题.并且还简单叙述了最新提出的Ethernet/IP的结构及其解决设备互操作的方法.
通用成帧规程GFP(generic framing procedure)是光同步数字传输网SDH上的新型数据包传输协议.作为新一代面向无连接的数据链路层协议,本文详细介绍了该协议的特点、帧结构和功能实现方式.
对于大型网络的网络管理系统而言,高度的扩展性是一个重要的指标,但传统的网络管理系统不能够满足这方面的需求.本文提出了一种框架结构,该结构采用了分层次的思想,使用了包括LDAP/JNDI、Web、智能代理等在内的一些新技术,可以很好地解决扩展性问题.
本文讨论性能管理系统的原理,设计了基于SNMP的园区网性能管理系统;给出了基于SNMP的性能管理系统的结构、功能描述和实现方法;主要从数据收集、数据分析及数据报告来阐明SNMP在性能管理系统中的应用.通过对此性能管理系统的设计与实现,从而提高网络管理的效率和质量.
通过研究各种网络攻击技术及其攻击模式判定技术,为分布地、实时地、智能地、可扩展地解决网络攻击模式的有效识别提供技术支持.