【摘 要】
:
场景图像分类是图形图像工作范畴的重要组成部分。分类算法的性能对解决场景图像分类问题起关键性作用。大数据时代,场景图像数量日益递增,图像特征维度井喷式增长,面对海量
论文部分内容阅读
场景图像分类是图形图像工作范畴的重要组成部分。分类算法的性能对解决场景图像分类问题起关键性作用。大数据时代,场景图像数量日益递增,图像特征维度井喷式增长,面对海量图像数据,传统的图像分类算法计算量急剧增大、时间性能骤然下降,难以适用于海量高维场景图像数据的处理。针对上述情况,本文设计和实现了一种基于MapReduce并行编程模型的场景图像分类原型系统。首先采用主成分分析法(Principal Component Analysis,PCA)对提取的场景图像的尺度不变特征变换(Scale-invariant feature transform,SIFT)特征进行降维处理,然后对降维后的特征采用随机森林(Random Forest,RF)算法进行分类。所有算法都采用MapReduce并行编程模型进行了并行化设计。主要研究成果如下:(1)提出了一种基于MapReduce并行编程模型的PCA-SIFT场景图像特征提取算法。该算法采用PCA算法对并行提取的场景图像的SIFT特征进行了降维处理。使用Sun Database场景图像数据库和实验室自建的煤矿场景图像数据库进行实验,实验证明本文提出的算法SIFT特征点检测效果明显,运行效率大幅提升,处理大规模图像数据集时,系统加速比呈线性增长的趋势,充分说明了算法在处理大规模场景图像数据的有效性。(2)采用Hadoop平台,给出了一种基于随机森林算法的场景图像并行分类算法。该算法包括学习和预测两部分,学习进程主要是通过生成多棵决策树来构建随机森林,预测进程则利用构建好的随机森林对输入的场景图像特征矩阵进行投票分类,算法基于MapReduce并行编程模型实现。经验证,该算法在Hadoop平台下,可伸缩性强且具有一定的可扩展性,性能良好。(3)根据上述实验过程,设计并开发了海量场景图像分类原型系统,实现了对大量场景图像数据的高效分类。
其他文献
线损率是一项经济指标,它可以体现电网的规划设计水平,反映电网的生产能力,表现电力工作者的管理水平。控制配电网线损率在合适的数值区间内,可以降低电力能源在传输过程中的
有学者预计,未来20年我国将有76%以上的就业岗位会遭受人工智能的冲击,如果仅考虑非农就业工人,这一比例也高达65%。人工智能等新兴数字技术对就业生态的影响既有积极也有消
1引言根据欧洲咨询公司(Euroconsult)最新研究,美国政府仍然是世界上最大的航天项目投资者,中国、俄罗斯、法国和日本紧随其后。美国2018年的航天预算总额为409亿美元,占世界
400MN钢丝缠绕模锻液压机是我国重型模锻液压机中的佼佼者,国之重器。整体机架采用剖分坎合、钢丝缠绕预紧结构,将整体机架化大为小,经钢丝缠绕成为一个整体,实现整体机架功能。模锻液压机在工作中,会经合模—保压—开模的往复过程,循环过程中活动横梁对机架的变形约束和侧向力变化会导致相邻子块间剪切力随之周期性波动,尤其在偏载工况下相对严重,所以机架整体性和坎合界面抗剪疲劳性对液压机的安全服役至关重要。本文
文章介绍了国内外求算可能最大降雨量的多种方法,并对各种方法的优缺点进行了比较,提出了应把两种方法即水文气象法和频率计算法结合起来,进行综合分析的见解。
基于相对危险度提出了一个新的假设检验问题,并就此检验问题,在配对设计下用delta方法构建了对数变换检验统计量,运用Monte Carlo方法模拟显示对数变换检验统计量有优良的统计性
<正>行业热点《关于加强县级融媒体中心建设的意见》审议通过近日,中央审议通过《关于加强县级融媒体中心建设的意见》。指出,组建县级融媒体中心,有利于整合县级媒体资源、
物理学是一门以实验研究为主的学科,很多物理现象的解释、物理规律的验证都离不开物理实验,物理新课程标准多次强调科学探究实验的重要性。可见物理实验在物理教学中有着举足
目的:观察以针刺结合背部走罐拔罐治疗慢传输型便秘的临床疗效。方法:将60例慢传输型便秘患者随机分成治疗组30例,对照组30例。观察组采用针刺结合背部走罐拔罐治疗,对照组采用
建立包容审慎的监管制度,是一场从理念到体制的深刻变革,需要我们正确认识和把握经济发展新趋势,正确理解和持续推进"放管服"改革,用现代监管理念审视既有的监管规则和执法现状