【摘 要】
:
传统的确定数据流管理系统及技术在近几年中得到了长足的发展并形成了成熟的研究领域。然而,随着信息产业各领域的不断发展和近似测量数据的硬件被大量应用,使得对不确定数据
论文部分内容阅读
传统的确定数据流管理系统及技术在近几年中得到了长足的发展并形成了成熟的研究领域。然而,随着信息产业各领域的不断发展和近似测量数据的硬件被大量应用,使得对不确定数据的研究形成了相应的领域并取得了相应的成果。在实际应用中,由于测量的不准确性,数据传输中引入的噪音以及数据源本身具有的不确定性,使得流数据的不确定性广泛存在并成为流数据的一个固有性质。因此对不确定性数据流的管理技术及其处理技术越来越被关注和重视。随着数据挖掘技术的广泛运用,近年来对不确定数据的挖掘做了大量的工作及相关研究。数据挖掘中的一个重要研究课题是聚类,对不确定数据流聚类算法的研究有重要的意义。在聚类过程中,描述对象间的相似程度以及簇间的相异程度通常是用距离来衡量的,因此描述不确定对象间的距离对于不确定对象的聚类算法的研究起着至关重要的作用。本文通过分析给出了计算不确定对象间距离的改进方法:摘要估计方法(ASM),该方法在计算不确定对象间距离时考虑了不确定对象的分布情况,将偏差纳入了计算过程,进而提高计算结果的准确度。然后提出了计算不确定对象与集合间距离的改进方法:平均组合距离(MPD)。与传统方法不同的是,MPD方法考虑了簇内所有元素对结果的影响,并将不确定对象与簇内所有元素距离的平均值作为不确定对象与集合间的距离。之后,提出了聚类过程中描述簇统计信息的向量:簇信息向量,该向量记录簇内所有元素的平方和等相关信息。最后,提出了一种不确定数据流聚类算法UKluStream,并通过实验验证了算法的有效性。
其他文献
CAD矿图是煤矿企业生产建设中一种非常重要的信息资源,随着Internet的迅猛发展,促进了其在网络上的应用。传统的CAD图形文件体积较大、依赖于特定的绘图平台,并且不同绘图平
传统蜂窝无线网络技术和无线局域网络技术都分别建立在事先部署基站和访问点的基础之上。无线自组织网络技术突破这种需要事先部署基础设施的要求,让网络中节点能够自主组网,
近年来,面向服务的软件体系结构逐渐成为软件工程领域的研究热点以及大型软件系统开发中的关键技术之一。人们逐渐认识到面向服务的软件体系结构在软件开发中的重要地位,好的软
随着我国信息化程度的提升,社会各行各业对视频监控系统的品质提出了更高要求,传统的安防监控系统面临着监控范围进一步扩大、前端设备种类繁多以及监控远程化等诸多问题,网络视
随着数字化医学设备的发展以及其在辅助诊断中的大规模应用,医疗机构每天都会产生大量的医学影像数据。由于医学影像数据存储在不同的地区,如何使异地医院的影像信息被本地医
随着我国科技水平的发展,电脑普及率迅速提高,办公自动化越来越深入到社会的每一种行业。对于从事人事管理工作的人事部门而言,信息量大是其特有的特点,这些人的信息每年都会
博客是Web2.0的典型应用之一。起初,博客作者将其每天浏览网站的心得和意见记录下来,并予以公开的方式给其他人参考和遵循。但随着博客的快速扩张,它的目的与最初已相去甚远。由
自从Bellare和Rogaway提出随机预言模型(Random Oracle Model, ROM)方法论,并将可证明安全的思想首次带入安全协议的形式化分析中以来,许多学者也相继应用ROM对提出的安全协
随着生产力的提高,经济社会的进步,车辆已经成为日益普及的交通工具。随之而来的问题就是,交通拥堵现象明显,交通事故频生。如何合理有效地提高道路的利用效率,从而缓解交通
实时系统时间分析的主要工作之一就是计算任务或系统的最坏情况执行时间(WCET)。由于目前大多数的实时嵌入式系统都采用了实时操作系统(RTOS)来管理和调度任务,因此系统的时间