低代价的数据流分类算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:killsmagicer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有数据流分类算法大多使用有监督学习,而标记高速数据流上的样本需要很大的代价,因此缺乏实用性.针对以上问题,提出了一种低代价的数据流分类算法2SDC.新算法利用少量已标记类别的样本和大量未标记样本来训练和更新分类模型,并且动态监测数据流上可能发生的概念漂移.真实数据流上的实验表明,2SDC算法不仅具有和当前有监督学习分类算法相当的分类精度,并且能够自适应数据流上的概念漂移.
其他文献
瓦斯涌出量的预测在煤矿安全问题中具有重要意义,利用小波分析将原始数据进行分解并重构,并利用AFT加快计算速度,重构后得到的数据通过灰色模型进行预测,将利用小波-灰色模型
TR069(CPE广域网管理协议)提供了对下一代网络中的家庭网络设备进行管理配置的通用框架和协议,其协议栈中包括SOAP,HTTP,SSL/TLS,TCP/IP等标准协议.当自动配置服务器(ACS)和网络终端设
随着现代多核和集群技术的快速发展,并行计算设计成为提高计算效率的主流技术之一.对此,提出了一种基于节点融合和分层的并行网络拓扑分析新方法.在电力网络正常运行时,首先
在软件开发中,并行开发已经成为了现实中标准的开发模式,因此软件开发的版本控制在开发过程中得到了非常广泛的应用.虽然大多数的版本控制工具都能完成分支合并以及将不同版
作为基于数据库管理系统PostgreSQL和Greenplum的数据分析软件,MADlib提供了一系列数学函数及数据挖掘方法.本文介绍了基于Java的MADlib自动化测试框架的设计与实现.该框架可在L
针对进口生鲜食品企业配送中心的选址问题,利用粗糙集对影响配送中心选址的属性指标进行约简,运用层次分析法建立多因素层次结构模型,并对Z企业的备选地址进行评价,将改进的
标签传播算法(LPA)是一种快速高效的社区发现算法,算法无需社区数量等先验信息,但存在大量随机性,稳定性较差.为了提高标签传播算法的稳定性,提出了一种改进的标签传播算法(LPAM
智能手机的快速普及推动着通信运营商不断开发新的诸如手机银行类的增值业务以增长利润,这些业务往往通过短信中心来完成.为了安全快速的实现这些业务,这里改进了信号发射台
在复杂的多态系统中,系统可靠性非常重要,最常见的是冷热备份模式来实现系统的可靠性.本文中我们提出了混合冗余备份模式,计算复杂系统的可靠性和任务成本,解决复杂系统中的
软件测试技术中,高效的测试用例生成能够大幅简化测试工作,提高测试效率,节省软件开发成本.遗传算法作为一种高效的搜索寻优算法已被广泛应用到测试用例自动生成的研究中,然