论文部分内容阅读
近年来,随着数字媒体技术的发展,数字相机等图像获取设备逐渐走入千家万户,数字图像的数量以指数级的速度迅速增长,不仅如此,互联网技术的发展也使得网络上充斥着大量的图像,如何对这些图像进行有效地管理,以及如何从图像海洋中找到自己需要的图像,已经成为亟待解决的问题,图像标注技术就是在这样一种背景下应运而生。图像标注是利用计算机自动分析图像的内容,用易于人们理解的语义词对图像所包含的对象进行标记的技术,它集成了数字图像处理、模式识别、机器学习等多个领域的知识,并且由于图像低层特征与高层语义特征之间“鸿沟”的存在,使得它成为计算机视觉研究领域的一个难点。目前,图像标注的基本流程是从已标注的图像(整体或分割后得到的图像区域)中提取颜色、纹理等视觉特征,然后结合特征和已有的标注信息进行机器训练学习,建立特征模型,最后对待标注图像进行特征提取后根据得到的特征模型,用一系列语义词进行标注。在这个过程中,图像分割和特征提取是非常重要的技术,对图像进行分割后,可以更加突出图像中包含对象的特征,而对视觉特征正确的提取与表示,可以提高标注的效率和性能,为此本文对这两方面的技术进行了研究。本文首先分类介绍了目前已有的图像分割算法,在实现采用的图论分割算法时,提出了一种新的基于最小区域的合并机制,并且在GPU上对算法进行了加速实现,使得算法在分割效果和时间效率上都有了很大提高。另外,按照MPEG7标准中提出的特征描述子对图像低层视觉特征进行提取与描述,保证了数据的规范性和可扩展性,并通过在得到的特征向量中添加10维位置权重,解决了由于图像纹理和颜色特征相似而引起的分类标注混淆问题。文中我们采用了SVM (Support Vector Machine支持向量机)分类器来训练模型和对图像区域进行分类标注,并通过统计标注结果的正确率验证了本文的工作。