论文部分内容阅读
据《2018中国餐饮业年度报告》统计,每年有近3.9万亿的餐饮市场,其中1.5万亿是食材采购费。目前我们已研发出智能电子秤用于食材的自动采购,该系统能够自动识别食材类别并对其进行称重。但是,由于餐厅的收货环境复杂多样,食材图像质量易受影响,并且各餐厅收购的食材数据分布也大不相同。因此,存在实验室到真实环境的过渡问题,即使用基于实验室的训练数据的训练算法无法很好的运用到实际环境中。另一方面,由于目前的数据集无法满足电子秤系统应用,因此构建了Meal-300数据集,其包含了300种食材,约53374张图像,但各类别数量处于10到453之间,从而导致了食材数据不平衡问题,即不同类别的训练数据严重不平衡,这将会导致数据较少的食材类别产生过拟合问题。针对以上两个问题,即实验室到真实环境的过渡问题以及食材数据不平衡问题。本文提出了一种基于深度迁移学习方法用于复杂环境下食材图像识别,该方法为基于领域混淆和先验树的CNN模型(TAN)。该模型与传统CNN相比,具有两个创新点,即跨越完全连接层的领域混淆以及用于分类的先验树。一旦源训练数据(实验室数据集)和目标训练数据(真实环境数据集)被传递到CNN模型,CNN网络层同传统CNN一样处理数据,然后通过完全连接层进行领域混淆,提取交叉域的不变特征,最后,强制执行先验知识树对数据进行分类,以克服不平衡训练数据带来的过度拟合问题。并且将TAN模型与目前已有的领域混淆的模型进行了对比实验,验证了该模型的准确性和可行性,实验结果表明对于复杂环境下的食材图像识别达到了58.75%的平均准确率。在实际的电子秤系统应用中,由于每个餐厅的每一天采购的订单非常相似。因此可以将每个餐厅的食材图像识别任务视为一个独立的目标领域。在该领域通过食材的重量来直接识别食材。这种比较重量特征可以结合到目标域分类中,而无需考虑领域差异。因此对TAN模型进行了优化,提出了TAN Scales模型用于实际应用中餐厅食材识别,并且提出了订单数据集Order-300用于实验研究,通过对TAN Scales模型和TAN模型进行比较实验,可得具有订单信息的TAN Scales模型能够进一步提高食材图像识别的准确性。实验结果表明在具体应用中,结合订单信息,食材识别的平均准确率高达72.45%。最后,基于TAN Scales模型,设计并实现了食材图像识别系统用于餐厅的食材采购中,该系统能对食材类别进行快速准确的识别。