论文部分内容阅读
机器视觉研究试图实现从2D图像到3D场景的推断。一个完整的机器视觉系统往往要涉及一系列复杂的过程,从图像获取、预处理、特征提取/选择,到更高级的推断决策。这些过程之间高度的相互影响、相互依赖,要实现真正成功的视觉系统需要研究人员对这些过程以及它们之间的关系有较深的认识。
介于机器视觉的复杂性,本文只集中讨论机器视觉领域中的四个重要问题,从底层到高层,分别为图像获取、图像预处理、特征选择和模式分类。在图像获取阶段,作者希望通过改造相机构造,以获取更多、更合适的视觉信息。通过我们提出的Slit光圈,我们可以同时获取全景深的清晰图像与图像深度图,在很大程度上优化了数据采集的工作;在预处理阶段,我们研究了经典的传感器灰尘导致的图像污点,成功的提出了一个自动检测/消除这些污点的方法,好的预处理方法可以使得后续的视觉算法更加鲁棒、更加精确。特征选择,是提取特征之后,做模式分类决策之前关键的一步,我们提出的CDFS方法能够自适应地为不同的类选择不同的特征,大大的提高了分类正确率。在模式分类阶段,作者提出的CamNN分类器通过优化距离测度,在保持与最近邻分类器相似的计算复杂度的同时,在性能上达到或超过了k-近邻分类器。