【摘 要】
:
随着计算机互联网技术的发展,实时数据流成为数据信息中一种重要的数据形式,且已被广泛应用于网络流量控制、数据监测系统、互联网金融等领域。如何快速有效的从高速、大量的
论文部分内容阅读
随着计算机互联网技术的发展,实时数据流成为数据信息中一种重要的数据形式,且已被广泛应用于网络流量控制、数据监测系统、互联网金融等领域。如何快速有效的从高速、大量的实时数据流中提取信息则成为数据流挖掘领域中的一大挑战,聚类分析是数据挖掘过程中一项重要技术,本文主要对实时数据流聚类分析算法进行研究。传统的聚类分析算法主要是对静态的数据信息处理,由于实时数据流高速性、实时性、持续性等特点,无法对其沿用传统的聚类分析算法。研究者们已提出多种面向数据流的聚类分析算法,其中,基于密度网格的聚类分析算法最能体现高效实时性,但存在网格边界处理粗糙导致精度不高、网格划分结构单一和网格动态性调整不足等问题。本文在其不足上做出改进,提出一种基于密度和网格的实时数据流聚类分析算法--DSG-Stream。该算法基于两阶段处理框架:在线层动态形成初始微簇,离线层通过宏聚类得到最终的聚类结果。该算法采用了粗细不同粒度的网格划分策略,通过网格在类簇中的位置将网格分为内部网格和边界网格:内部网格用粗粒度的网格基于网格影响因子进行聚类,边界网格则进行细粒度的聚类处理,还包含了对孤立网格的探测和处理,网格密度阈值的动态调整,从而提高了算法的效率,为了进一步提升处理效率,还设计了分布式环境下该算法的相关模型。通过实验对比和分析,DSG-Stream算法的聚类精度较高,实时性强,且运行状态稳定。最后将DSG-Stream算法应用于光纤保护监测系统中,结果显示该算法在系统中表现了良好的性能。
其他文献
智能电网中部署了各种监控系统和高级监测体系,设备中获取与传输的各类数据发生着指数级的增长,整个电网随时都在产生海量的重要数据被收集到远程终端并对它们进行统一管理,大量数据频繁采集、传输带来网络堵塞的同时更对电网通信的实时性、准确性及安全性提出了新要求。云存储系统可以提供海量的存储能力来解决智能电网中的大数据存储问题。随着云计算技术的发展,云安全变得越来越关键。在云计算环境中,用户对放置在云服务器中
爬壁机器人作为一种极限机器人,已经成为当前机器人领域中研究的一个热点,它能代替人工在极限条件下完成多种作业任务,降低了人工作业的难度与风险系数,无论是在军用领域还是
无线传感器网络不同于传统的网络,无线传感器网络通常被部署到恶劣或是特殊的环境中,一般无法实现对其节点进行充电或更换电池,所以如何通过优化节点分布来实现无线传感器网
准确而自动的表达出体数据模型中包含的结构信息是可视化领域尚未完全解决的难题。传统的基于物理光学模型的可视化方法主要试图实现真实感的图像绘制效果,很难突出体数据中感
随着网络信息产业的发展,服务器的工作效率和可靠性的要求越来越高,集群技术和云计算技术随之诞生并开始蓬勃发展,虚拟化技术作为实现云计算的关键技术也越来越被关注。在虚拟化
随着互联网技术的飞速发展以及云存储技术的不断完善,大规模数据的处理机制也发生了巨大的变化。面对在互联网应用中每天产生的大规模数据,本中心提出了面向双边资源整合服务模
在对计算机模拟MBR研究中,发现由于膜在空间上仅占据整个系统的很小一部分,造成了模拟中对膜过程实际现象进行充分、深入表达的需求与计算量限制之间的矛盾,从而导致“仿而不真
随着电生理仿真规模的大幅增加并随之而来的数据量的剧增,人们越来越需要一个能够实时可视化并且能够在计算过程中进行干预控制的电生理仿真系统。如何完成这样一个电生理仿真
风能,作为可再生能源,无穷无尽,清洁环保,已成为许多国家可持续发展战略的一个重要组成部分,因此,风力发电得到了迅速的发展。风电机组工作环境恶劣,长期受到正常和极端温度、降雨、积雪、沙尘、太阳辐射等环境因素的影响,各部件也必将不可避免随着运行时间的变化而老化,可靠性下降,导致故障发生,影响风电场的安全稳定。风力发电机作为风电机组故障率较高的部件,对其进行实时状态监测,及时发现故障征兆,确定合理的维护
人脸识别作为一种典型的生物特征鉴别方式,已经成为模式识别领域中一个重要的研究方向,具有广阔的应用前景。近年来移动互联网的迅速发展对人脸识别的应用也随之产生了新的需求