基于资源争夺和快速追踪行为的特征选择算法

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:xy255c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今世界逐渐从信息化转型为数据化,模式识别和数据挖掘等领域面临越来越大的挑战。爆炸式增长的数据量使得特征选择过程成为大数据模式识别等领域必不可少的环节。特征也是一种资源,本文受启发于自然界中生物获取食物资源的两种方式:1)通过争夺其他生物资源获取资源;2)通过搜寻获取资源来对特征选择算法进行研究。通过分析生物获取资源的方式对资源争夺行为和资源搜寻行为建立行为模型和行为关系模型,研究基于公平模型和基于追踪模型的特征选择算法。  研究生物通过争夺获取资源的行为建立动态交互模型、群内竞争模型和公平模型,提出基于公平模型的特征选择算法。本文在研究基于公平模型的特征选择算法过程中,将特征选择问题模型转换为资源分配问题模型,所选择的特征子集长度作为资源分配给所有的特征,在资源分配过程中加入资源争夺行为,通过提出的多群体公平算法对其进行评判和处理,以期得到更优的资源分配方案。在资源分配过程中利用待分配个体能力值(启发式信息)以及分配的随机性将启发式搜索和随机搜索两种策略有效融合在一起;在计算分配效益时,同一定量资源分配问题中,分配效益的计算使用filter方法(特征子集区分度评价准则);不同定量分配效益评价使用wrapper方法(分类器性能),在降低计算量的过程中能够得到分类性能更好的特征子集。  分析生物通过搜寻获取资源的行为,研究个体搜索资源的个性行为,引入蚊子追踪模型得到基于追踪模型的特征选择算法,在特征选择问题模型下建立个体目标追踪行为模型、整体追踪目标行为模型、目标吸引力模型和个体间交互行为模型。在个体不断接近追踪目标以及不断搜索更优追踪目标的过程中不断优化个体的权值向量(不断优化特征子集选择)。本文在不失一般性的分析下,参照函数极值问题存在的多种可能性对基于追踪模型的特征选择算法的有效性及可行性进行了分析。  本文提出了基于多群体公平模型的特征选择算法和基于追踪模型的特征选择算法,算法思路主要为:1)对待解决的问题进行描述并建立数学模型;2)给出算法的详细分析及解决问题的步骤;3)给出算法收敛性和有效性证明;4)通过在UCI数据集上测试提出的算法;5)与其他算法进行比较。理论证明和实验结果表明,本文提出的基于多群体公平模型的特征选择算法和基于追踪模型的特征选择算法是有效的,对于数据量呈爆炸性增长环境下的模式识别和数据挖掘等领域有一定的应用价值。
其他文献
随着互联网和多媒体技术的快速发展,图像成为一种极其重要的信息资源。如何快速检索如此巨大的资源就成为学术界亟待解决的问题。目前,基于语义的图像检索方法是一种流行的检索
随着人们通过移动网络的交往越加频繁,电信运营商积累了越来越多的个人信息以及用户行为数据,这些数据具有非常大的价值。如何对这些数据进行分析,使用这些数据建立模型,从而
随着互联网的不断发展和革新,传统互联网本身的系统结构局限性产生了越来越多的问题,网络规模指数级增长、多宿主、流量工程、服务提供商的独立性等需求导致了路由可扩展问题
随着民用航空业的迅速发展,这对机场管理的各个方面都提出了新的要求,如不同航站楼生产管理系统信息的交互,不同的体系结构的融合,信息更新频率的设定等。互异分布式系统消息
目前,我国的电信行业已经进入了全业务运营的实施阶段。各电信企业在完成业务的重组,建立新的竞争优势的同时,更把目光投向未来,瞄准了一些发展潜力巨大的战略性新兴市场。在
RTEMS是支持多处理器的开源的商业级嵌入式实时操作系统,目前广泛应用于航空航天、通信、军工、医疗、科学计算等领域。RTEMS支持多种API,如POSIX、ITRON以及RTEMS Classic PI,
随着多媒体技术和网络技术的迅速发展,以及大量视频应用的广泛普及,视频内容呈现快速增长趋势。面对海量的视频,如何对之进行有效的管理,使用户能够迅速检索到想要的信息,成
随着数字出版市场的快速发展,以电子图书为代表的电子文档数量呈现爆炸式的增长。为了保证电子文档的安全发行与传播,数字版权保护技术作为数字内容网络发布的关键技术成为当
无线感知反应网络已成为计算机领域的最受关注的前沿课题之一。本文以无线感知反应网络在依托,提出一种智能楼宇系统的解决方案。   为了实现智能楼宇系统所应有的功能和性
计算机数控技术是装备制造业的重要支撑技术。高档数控系统在可靠性、精度、速度、安全性等方面提出了更高的要求。任务同步是影响操作系统性能和实时性的重要方面。非阻塞同