流数据聚类挖掘算法研究

被引量 : 0次 | 上传用户:zxcvzo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。流数据分析在数据挖掘领域中的重要性日益凸显,其中流数据聚类已经逐渐发展成为一个重要的研究热点。本文针对双层流数据聚类算法框架进行了深入的研究,主要包括以下内容:1,深入地研究了在线层算法对数据的表达方式。提出新的数据结构“格簇”来解决在线层算法中数据仅能根据临时分布状态确定所属聚类,从而导致算法精度受损的问题。提出新的数据结构“N-维球簇”,能够有效地解决流数据基于密度聚类的问题。2,提出一种基于Agent方法的双层流数据聚类算法,在较低的时间开销下能够得到质量较高的聚类结果。算法对初始化数据不敏感,不需要切割数据流,保持了全局信息的完整性。算法同时支持数据流上的时间窗口分析。3,提出一种基于密度的流数据聚类算法,能够有效地解决数据空间中存在不规则分布密集区域的聚类问题,实验结果表明该算法能够有效地标识空间中的不规则形状簇。4,开发出一套聚类挖掘工具软件,集数据生成,数据分布可视化,可重用聚类算法模块为一体,应用设计良好的开放式架构,用于缩短新算法的研发周期。
其他文献
随着热控自动化检测及控制技术、汽轮机监测仪表的精确度及灵敏度、DEH控制系统的控制精度及速度的提高,机组对外界工况变化的响应速度亦有了大幅提升。文章以国华徐电#1、#2
在城市化的快速发展下人类活动和生态环境的矛盾日益加重。本文以珠海天沁园的景观设计为例,以海绵城市为设计理念,既满足生态效益,同时也创造良好的城市景观,良好优化功能布
本文以Himont公司Spheripol本体法聚丙烯生产工艺为例,研究了聚丙烯连续生产过程中产品的牌号切换问题,进行了建模和优化工作,在此基础上,将理论与实际相结合,阐述了最优牌号
寻求一种能快速修复皮肤损伤的创面修复材料是是临床和科研工作者亟待解决的难题。海藻酸盐水凝胶不仅能为创面愈合提供利于愈合的湿润环境,还能吸收渗出液。生物活性玻璃(BG
一家过度依赖资本运作却忽视实业经营的上市公司,同样很容易被资本大鳄或竞争对手打败,丧失对公司的控制权;不注重实业经营,而无限制地进行过度的资本运作和扩张,上市公司及
阅读古典著作,丰富国学知识,可以弘扬传统文化,汲取古代人遗留下来的知识精华与人生智慧,不能说是坏事,尤其是在目前大力弘扬传统文化的氛围之下,阅读古代经典,更应该加以鼓
武满彻(Toru Takemitsu,1930-1996),20世纪日本作曲家,其作品带有鲜明的个人特色。本文以武满彻为钢琴、管弦乐队而作的ASTERISM为研究对象,分析作品的核心素材、管弦乐配器
南瓜子营养丰富,含有人体所需要的蛋白质、脂肪酸等生物活性物质,对人体有驱虫、缓解高血压和抗炎等功效。本研究选用中国南瓜、印度南瓜、美洲南瓜和黑籽南瓜共计17个品种,
在当今日益激烈的竞争和复杂的动态市场环境下,正确及时的决策是企业生存和发展的重要环节。企业要在竞争中取胜,至关重要的是必须利用计算机和网络技术并结合数据仓库等技术
有机磷类农药具有高效、低毒、低残留等特点,在保证农作物增产保丰的同时,长期大量使用所造成的环境污染已不容忽视。环境微生物降解具有高效率、低成本、无二次污染、降解彻底