基于MPI的并行Haar Training算法研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户：txmotor

【摘要】

：

图像信息的分类器的作用在于识别人脸图像和非人脸图像。对于一个实际使用的分类器，其判断人脸的正确率要求是99.9％以上的精确。而现有的HaarTraining算法能实现分类问题，可以训

【作者】

：

郭思涵

【机构】

：

中国地质大学(武汉)

【出处】

：

中国地质大学(武汉)

【发表日期】

：

2012年期

【关键词】

：

HaarTraining算法弱分类器主从模式 MPI并行编程工具关系模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像信息的分类器的作用在于识别人脸图像和非人脸图像。对于一个实际使用的分类器，其判断人脸的正确率要求是99.9％以上的精确。而现有的HaarTraining算法能实现分类问题，可以训练一个强分类器，同时也能实现训练级联的强分类器(CascadeofClassifiers)。该算法能根据给出的正样本即人脸图像，作为训练分类器的基本数据，得到一个级联的分类器。再通过给出的负样本即非人脸图像，来判断训练出来的分类器能否识别出非人脸，只有当分类器的正确率达到了，才能得到强分类器。按照以往的训练经验来说，一个满足要求的级联分类器至少需要100个弱分类器组成，弱分类器训练是一个迭代过程，每个弱分类器的训练时间与样本数量有关系，样本数量越多获得一个最优弱分类器的时间耗费就越长。因此强分类器的训练时间太长，为了解决耗时问题，就需要使用并行计算的思想。　　首先，剖析现有HaarTraining算法。通过分析算法的原理、算法结构，考虑训练算法的整个过程。该算法训练级联分类器的流程，主要由创建Haar特征，载入正负样本数据，计算Haar特征值，保存结果，测试分类性能等部分构成。其中以20*20尺寸的样本为例，包含的特征值有七万多个，弱分类器就由某些特征值组合而成，算法再选取效果最好的弱分类器，将其组合成级联的强分类器。　　其次，通过分析该算法，确定并行点，并进行HaarTraining算法并行的可行性分析。AdaBoost算法中各个弱分类器误判率的计算存在彼此计算不相关，程序计算前后顺序对计算结果没有影响，即:每个弱分类器的计算符合并行化的特点。将弱分类器集合分发到各个并行节点是可行的。即不保存上一步状态的弱分类器计算并行是可行的。　　然后，选择合适的并行编程技术。MPI，作为目前最重要的并行编程工具，其编程方法的优点是显著的，最大优点是其高性能，具有丰富的点到点通信函数模型、可操作数据类型及更大的群组通信函数库。主要通过多个节点间的消息传递来实现并行，它具有非常良好的移植性，有相当多支持它的硬件设施。采用该编程方式，对现有串行程序的整体代码更改量不会过大，而且该编程技术具有强大的功能和的高效性。所以本论文采用MPI的并行编程技术来实现。　　最后，在确定了并行点和实现方案后，结合进程组的主从模式(Master-slave)，将并行点用MPI并行编程技术实现。主从模式是指进程组的关系模型，主要包括一个“主进程”，其他称为“从进程”;这两种进程分别负责不同的任务，主进程负责整个并行程序的数据控制任务，而从进程只需要对该节点上的进行数据处理和计算任务，主从进程间的通讯需要通过数据广播(BroadCast)，数据收集(Gather)，数据散发(Scatter)来实现。而这些功能在MPI并行化框架中都提供了完备的程序支持，并将计算结果send给主进程。并通过实验结果证明多个进程的训练时间比原有的训练时间有所减少，同时也做了对比实验，随着进程数的增加，训练时间是不断减少的，但是并不是与进程数呈比例的趋势减少，其下降的幅度有一定程度的减小。

其他文献

描述语义Web服务的带类型的OWL-S

在语义Web服务的相关研究工作中,以Web服务的组合、发现为目的,已经有大量的研究人员和研究机构对其进行了广泛的研究,其中包括:OWL-S;以工作流为基础的Web服务组合;扩展现有

学位

语义Web服务OWL-S一阶动态逻辑服务验证

基于Kinect的青少年健身体感游戏设计与实现

国民的身体健康及体质状况是一个涉及到国家长治久安、兴旺发达的根本因素。然而本世纪以来，伴随着社会生活节奏的逐渐加快，以及物质生活的日渐丰富，传统生活模式和生活习惯已然

学位

体感设备游戏设计人机交互虚拟现实

基于FPGA的星载SAR实时成像处理关键技术设计与实现

本文以提高合成孔径雷达(SAR)实时成像处理系统性能为目标,重点研究并实现了SAR成像处理算法中三个关键运算单元。　　论文设计并实现了一种高性能定点FFT IP核。论文从DFT

学位

现场可编程门阵列星载合成孔径雷达实时成像处理运行频率性能指标

多核高性能处理器软件平台的设计与实现

近年来，由于材料和加工技术的限制，单核处理器的性能已经难以有所提高了，无法满足应用的需求。为了进一步提高处理器的性能，必须采用多核结构的处理器。多核处理器采用了并行计算

学位

多核处理器嵌入式系统软件平台任务调度工作机制

基于SSD的缓存管理策略的研究

随着数据量的增加和数据存储操作性能需求的提高,传统基于DRAM+HDD存储架构的存储系统面临着严峻的挑战。由于HDD的I/O时延过高,HDD已经成为数据存储系统的性能瓶颈。相对于H

学位

海量存储系统缓存管理策略数据筛选数据聚合功能模块

基于域名访问数据的停靠服务检测技术研究

学位

并行平衡反演程序在EAST实时控制中的集成

EAST等离子体控制系统(PCS)继承于DIII-D的等离子体控制系统架构，以等磁通控制作为等离子体位形控制的主要方式，并且利用RT-EFIT程序作为位形控制过程中基本的平衡反演工具。由

学位

全超导托卡马克装置等离子体控制系统并行平衡反演程序实时控制

Green Scheduling:一种提高MapReduce能效的调度策略

数据中心的能效问题受到了越来越多人的关注,降低数据中心的能耗不仅直接关系到降低运营成本,还有助于减少温室气体的排放。MapReduce已经成为了数据中心主要的大规模数据处

学位

MapReduce集群生命周期功耗特性调度策略

融合型可用性评估方法及其在双语教学软件评估上的应用

随着时代的发展，信息技术已经深入到社会生活的各个领域，软件开发也从最初的小规模作坊模式演变为今天的大规模系统化工程。质量控制、成本管理已不仅仅是软件开发需要考虑的唯

学位

数据挖掘可用性评估双语教学软件质量控制成本管理

基于云计算平台的转码服务器的设计与实现

近年来互联网技术和新媒体得到了高速的发展,很多基于新媒体的应用在软件市场上越来越丰富,尤其是视频业务已经成为用户的“新宠儿”。当前市场上,由于终端设备类型的多样化

学位

视频转码HadoopFFmpegMapReduce

基于MPI的并行Haar Training算法研究

与本文相关的学术论文