论文部分内容阅读
针对大规模图像场景分类速度缓慢的问题,提出了一种Hadoop环境下基于PI。DA的图像场景分类方法.首先利用Hadoop分布式存储系统HDFS存储图像数据;其次通过扩展MapReduce数据类型以及输入类型使得每幅图像作为一个MapReduce任务的数据处理单元;然后利用MapReduce分布式提取图像SIFT特征,并使用Bag—of—Features模型将其转化成词频向量;最后使用MapReduce实现了PLDA算法,并在此基础上完成了Hadoop环境下基于PLDA的图像场景分类.实验结果表明,该方法能