基于UFFT的数据流集成分类器研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:hhzzmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前很多实时系统以空前速度产生巨量的数据,这对数据挖掘方法研究一直是一种挑战。常见的数据流包括网络事务日志,电话接听记录,信用卡交易事务流,传感器记录数据流等。这些数据中潜在的知识或者机制需要我们从数据中挖掘出来。数据流庞大的体积是知识发现工具面临两大困难之一。数据流的分类已成为数据挖掘研究的热点之一,常用的处理数据流的分类算法分为两类,单分类器和集成分类器。其中,集成分类器聚集多个分类器,这些具有独立预测性能的分类器通过某种方法形成最终预测结果。虽然集成分类器具有高精度等优势,但构造过程中采用了非增量式算法构建,因而造成了时间性能较差,且耗费较高空间资源。针对这些问题,本文提出了一种集成分类器优化算法。本文的主要工作如下:(1)概述了数据流挖掘的理论基础、数据处理常用算法;介绍了数据流分类算法,详细描述了集成分类器技术,并对数据流的未来进行展望。(2)针对已有的weighted-bagging模型时空性能的不足,提出一种基于UFFT的weighted-bagging算法UFFT_wb。该算法基于weighted-bagging模型,以UFFT算法构建基分类器。实验表明,算法UFFT_wb具有确定分割点及选择分割属性花费时间少、构建新结点占用空间小、可以增量式构建等特点,与基于C4.5算法的weighted-bagging模型相比,在保持精度的基础上,时间性能有一定程度的改进。(3)基于上述研究,实现了数据流分类原型系统。
其他文献
RFID与企业业务流程进行集成已成为RFID领域的一个重要的研究方向。而现有的RFID业务流程集成方案大都基于传统的业务流程引擎,并不能很好地满足RFID业务流程的需求。并且现
Ad Hoc网络是一种不依赖于固定基础设施的移动网络,在这个网络模式中,移动节点既是主机也是路由器,它是完全自组织、自适应的由无线节点组成的新型网络。无论是在军事、抢险,还是
在E-learning教学环境中,多媒体课件是使用最为广泛的教学内容载体。而针对多媒体课件的检索服务可以使学生方便地选择他们所感兴趣的部分从而提高了教学效率。基于语音的内
随着云计算技术的发展,云存储服务逐渐成为商业应用及个人应用普遍采用的存储解决方案。用户向云存储服务端发出文件下载请求,云端服务器收到请求后开始提供内容分发服务,内
随着RFID应用规模的不断扩大,读写器网络以及网络中的RFID数据流变得越来越复杂,这对RFID中间件提出了新的要求。在RFID网络化应用中,中间件需要全面地获知读写器网络以及网
随着Web技术及其应用的快速发展,XML已经成为万维网上信息表示和数据交换的一个重要标准,XML在电子商务、电子数据交换、科学数据表示、数据建模与分析和搜索引擎等领域有着
视频序列中运动目标跟踪技术是计算机视觉领域最活跃的课题之一,它涉及到图像处理、模式识别、自动控制等诸多领域,具有较强的研究价值。基于粒子滤波理论的目标跟踪算法是一
句法分析是自然语言处理的关键技术之一,其主要任务是消除句子中由词法和词组结构引入的歧义问题。句法分析对自然语言处理起着至关重要的作用。一方面,句法分析能够有效地验
随着计算安全的深入,不但软件安全,硬件安全或防范物理攻击,也越来越受到重视。SMP系统作为重要的商用平台,增强其防范物理攻击具有重要的意义。防范物理攻击最基本的技术手
多核处理器技术成为处理器设计的主流,随着内核数量的增加,处理器功耗密度随之增长。引入相应策略对多核处理器进行功耗管理是必要的。现有的处理器大都采用硬件的动态电压和