面向网购平台的商品图像类别预测方法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:dracula1103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网购平台(如亚马逊,淘宝等)蓬勃发展,大量互联网用户选择在线网购作为重要的购物方式。网购平台为提升用户购物体验,将图像作为商品展示中不可缺少的一部分。这同时也为网购平台成功积累大量的商品图像。网购平台中海量商品图像的出现,为更好地组织、检索和查看商品创造可能。例如,用户可以通过一幅简单图像,查找相关的商品。然而,这并不是一项简单的工作,因为低层次的视觉特征和真实世界的商品之间有着巨大的区别。因此,如何预测一幅图像中商品的类别,成为一个重要的问题。事实上,商品图像类别预测基于图像分类的方法。但与传统的图像分类应用相比,商品图像类别预测问题不但需要利用海量社会化标注的图像,更需要对现实世界中商品的海量类别进行预测。本文为构建一种完整的商品图像类别预测方法,提出数个具有良好扩展性、适用于大数据处理的算法和模型。在这种自动化方法中,利用易于从互联网获得的社会化标注图像是基础。然而,这些数据中图像与他们类别标签间的关系存在不确定性,这导致从图像搜索引擎获得的图像中总有不相关图像存在。过滤这些不相关的图像是一个大规模数据的单类别预测问题。为解决该问题,本文采用一种基于图分割和KNN分类算法的模型。为描述大规模商品图像数据,本文选取视觉词包特征作为图像多类预测任务的特征。然而,经典的聚类算法无法解决海量视觉兴趣点条件下视觉词典的训练问题。为解决该问题,本文提出一种加速的K-means算法。在这种算法中,三角形不等式被用于减少冗余计算。而Hierarchical K-means算法则被用于选取更佳的K-means算法初始中心点。为解决类别数目特别巨大时的类别预测问题,本文提出一种多类预测模型。针对预测模型中基础的两类分类问题,本文研究选用χ2-RBF核的SVM分类器。而为完成最终的多类预测任务,本文设计并提出一种基于双败思想的层次预测方法。基于上述模型和算法,本文提出的商品图像类别预测方法具有优秀的时间性能,在大规模商品图像数据应用中具备可行性。另一方面,在商品图像数据集上的实验,成功验证本文所提出图像类别预测方法的有效性。
其他文献
随着数字信息从文本到多媒体的转变以及社会信息化进程的加快,信息量开始呈几何级数爆炸性地增长,海量数据的存储和处理受到社会各界越来越广泛的关注。分布式存储系统(Distrib
针对教育工作者照顾面有限,难以与家长、学生全面沟通的问题,设计并实现了基于UM思想的大学生教育管理交互平台,拓宽了教学部门的对外联系渠道。系统引入了统一消息的概念作
本文对CDMA2000 1X无线接口协议的寻呼技术、切换技术、功率控制技术,按照集群通讯的特点进行了优化和改进,设计出了集群应用环境下的无线接口协议,并描述了它们在集群终端中
本文对基于P2P架构的SIP的应用进行了研究。文章在分析了普通SIP应用和P2P技术的特点后,通过把二者结合起来,进行了P2P架构下SIP应用的研究,并实现了一个P2P-SIP的电话(可视频)
  本文针对点菜系统实时性的高要求,提出了一种新的提高点菜系统实时性能的方法,即利用内存数据库技术来解决实时性需求。它能够高速缓存常规磁盘数据库中的数据,减少了内外存
本文作者设计开发了针对宝钢钢管冷区L3的MES。它分为作业计划管理、仓库管理、生产管理、设备停机实绩管理、质量管理、物资及生产备件管理六个子系统。系统从L4接收生产计
本文以面向电子商务的集成供应链管理(EC_ISCM)软件开发为背景,探讨网络计划法和现代软件工程方法在工艺路线中的应用问题,旨在建立可重组工艺路线软件构架与构件模型。 本文
近年来,运动捕捉技术在计算机动画等领域得到广泛的应用,引起了广大专家学者的极大关注。然而现有的运动捕捉系统大多存在着捕捉设备过于昂贵、表演者动作受限等缺点,从而制约了
本文主要研究了在构建网络管理系统的标准TMN(Telecommunication Management Network,电信管理网)的框架下,网络故障管理的基本需求和功能集,以及分布式的故障管理系统的架构、
本文以燃气表的远程维修为研究背景,提出了基于GPRS网络的嵌入式解决方案,论述了基于GPRS网络的嵌入式手持终端的设计与实现及对相关技术的研究。文章以嵌入式手持终端的设计为