【摘 要】
:
相对于静态空间下的特征选择算法,有关动态特征空间下的特征选择研究并没有引起足够的关注。数据特征空间的动态性是指在算法开始前,问题的特征空间不是或不能提前获得,而是
论文部分内容阅读
相对于静态空间下的特征选择算法,有关动态特征空间下的特征选择研究并没有引起足够的关注。数据特征空间的动态性是指在算法开始前,问题的特征空间不是或不能提前获得,而是随时间动态变化。因而,数据特征空间的动态性对传统静态特征空间下的在线知识发现算法提出诸多新问题和新挑战。本文主要针对在线流特征选择和动态空间下特征选择算法的应用进行分析和研究。针对既包含历史数据又有流特征数据的全新场景下的在线特征选择问题,本文提出了一种基于特征聚类集成技术的在线特征选择算法。在对历史数据的组特征选择阶段,为了弥补单一聚类算法的不足,引入聚类集成的思想。先利用k-means方法通过多次聚类得到一个聚类集体,在集成阶段再利用层次聚类算法对聚类集体进行集成得到最终的结果。在对流特征数据的在线特征选择阶段,对组构造产生的特征组通过探讨特征间的相关性来更新特征组,最终通过组变换获得特征子集。实验表明,所提算法能有效应对全新场景下的在线特征选择问题,并且有很好的分类性能。此外,本文还介绍了一种针对梯形流数据的在线学习方法,并将该算法和所提算法应用到社交媒体数据的特征选择上。应用结果表明:这两种算法能有效解决社交媒体中不同情形下的在线学习和在线特征选择问题。
其他文献
色彩对于图像增强、目标识别等许多研究领域都是非常重要的信息。准确的色彩信息对数字图像视频的下一步处理具有关键意义。色彩恒常性是指在不同的外界环境中,人眼对物体色
核电站智能机器人是现代核工业不可缺少的工具,更是现代核工业未来的发展目标和方向。专家系统是一种模拟人类专家解决领域问题的计算机程序系统,是人工智能应用研究中最活跃
搜索引擎作为信息检索技术在互联网时代的应用,使人们能够更有效的从互联网获取各种资源。但随着互联网的发展,传统的搜索引擎,即通用搜索引擎渐渐不能满足人们对信息检索服
营销领域的“口碑效应”现象和“病毒式营销”推广方式提出了如何在人群中寻找影响力最大的用户的问题。该问题与社会网络影响力模型及其算法领域的研究内容有着很高的契合度
完善的访问控制管理和有效的SQL注入防范是保证Web应用安全的两个重要方面。本文综述了国内外基于角色的访问控制及SQL注入防范方面的研究现状,提出了基于RBAC的细粒度访问控
水下无线传感器网络由部署在监测水域的低成本、自组织的智能传感器组成以去协同完成水域环境监测的任务,在环境监测、无人监控深海区域、自然灾难预防、军事预防等领域有着
随着网络技术的发展和计算机的普及,近些年来P2P技术得到了很快的发展。将具有动态性、开放性和匿名性等特性的P2P技术应用到电子商务上,使得电子商务交易更加灵活的同时,也
应用层组播技术是传统组播技术在应用层的拓展,以个人计算机等设备为传输和通信的终端,有效地隔离了IP组播在技术和安全层面带来的不足。但是以往的组播协议在用户自私性问题
人-机交互(HCI)是指人与计算机之间进行信息交换的过程。由于眼动信号具有可控性强、易于采集等优点,因此基于眼动的人-机交互系统(如:鼠标控制系统、轮椅控制系统、虚拟键盘系统等)的设计与开发已得到研究者越来越广泛的关注,并逐步走进了人们的生活。一般来说,按照功能的不同,眼动信号大致可分为扫视、注视、平滑追随和眨眼4类。其中,扫视信号作为发生频率最高的一种眼动行为,其扫视方向的多样性将有利于生成更多
传感器节点的自定位技术作为无线传感器网络重要支撑技术之一具有重大的研究价值。在许多实际应用中感知数据只有结合位置信息才具有意义,而使用GPS收发器,成本和能耗较高不