面向移动终端的衣服搜索算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hellen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的线上衣服购物场景中,用户在搜索商品时需要输入关于衣服商品的特征描述关键字。由于关键字描述能力的局限性,这种方式下系统搜索到的商品往往和消费者的意图不匹配,而且关键字输入也给用户体验带来不好的影响。特别是在移动互联网的场景下,移动终端能够很方便获得期望商品的外观图像。如果系统能够直接根据移动终端获取的图像完成搜索,做到所见即所得,则无疑会给线上购物带来巨大的便捷。基于以上的应用背景,本文开展了基于移动终端的衣服图像搜索算法设计与应用开发研究。针对移动搜索系统的能耗限制和网络传输时延以及搜索精度和速度问题,主要完成了以下工作:首先采用视觉词汇树来提高单词量化效率,视觉词汇树通过将视觉词典组织成树状结构将量化的计算复杂度降低到对数级别,以降低移动端量化过程的能耗。同时,利用衣服图像的视觉单词向量的稀疏性特点,降低系统的网络传输负载,提高系统响应速度。针对搜索精度和速度,本文基于乘积量化思想提出融合衣服图像的纹理和颜色视觉词典的融合索引搜索算法提高搜索系统的搜索性能。由于算法中衣服图像的视觉词典是通过对两种视觉词典进行笛卡尔乘积得到,它通过两个规模较小的视觉词典构造得到单词空间较大的融合词典,因此相比于传统的单倒排,融合索引具有更强的表达能力。除此之外,由于融合索引将两种视觉单词融合到一个视觉词典中,因此可以避免对多种单词分别建立倒排索引,有效提高搜索效率。最后,基于融合索引算法,针对衣服单词向量的特点,借鉴文本搜索中的TF-IDF(Term Frequency-Inverse Document Frequency)技术来对视觉单词向量进行优化,提高单词向量的辨识度。同时,结合衣服单词向量特点,采用余弦相似度计算方法克服融合视觉单词向量维度过高带来的高计算复杂度问题。本文通过一系列实验对算法进行了分析验证。首先基于具体衣服图像数据集对单词向量构造算法进行性能比较,验证单词构建算法的能耗和搜索精度性能。然后对融合搜索算法进行了仿真实验分析,分析了不同规模视觉词典下的搜索性能,并验证了融合索引相对多级索引在搜索速度上具有较好的性能。最后,本文基于智能手机对衣服搜索系统进行了实现,通过比较实验验证了基于颜色纹理视觉单词和融合索引搜索算法的衣服图像搜索系统具有低延迟、低能耗、高效率等实用性特点。
其他文献
(一)伊马替尼治疗慢性髓性白血病后3、6个月BCR-ABL的预后价值目的:探讨伊马替尼治疗慢性髓性白血病(chronic myelocytic leukemia,CML)3、6个月后BCR-ABL转录本水平在疗效监
金属有机骨架材料(MOFs)是一类由金属离子和有机配体通过配位键连接形成二维或三维网状晶体结构的多孔材料,具有独特的拓扑结构、孔隙率等良好的物理特性,因而在储氢、气体储存、催化、传感和光电池等方面引起了广泛的关注。MOFs比表面积大、具有可修饰调控的均匀孔道,这些孔径一般小于2 nm,是催化活性粒子的理想尺寸,具有稳定纳米金属团簇的能力。因此在其孔道内负载金属纳米颗粒形成复合材料,既能使金属纳米颗
计算群之间的同态个数是群理论中的基本问题之一.本文利用数论以及群的生成元与生成关系的相关知识,具体计算出了 n阶循环群通过4阶循环群扩张的亚循环群Gn到模群Mpβ的同态个数,以及n阶循环群通过2p(其中p为奇素数)阶循环群扩张的亚循环群Gn,2p到二面体群D2m,该亚循环群Gn,2p到拟二面体群QD2α,该亚循环群Gn,2p到四元数群Qm和该亚循环群Gn,2p到模群Mqβ的同态个数.作为应用,也验
短波红外(SWIR)技术是近年来新兴的一种矿产勘查研究手段。该技术的核心是依据蚀变矿物中羟基(OH-)、碳酸根(CO32-)、硫酸根(SO42-)以及可能存在的水分子等不同粒子对光能吸收而展现出特征光谱带,来确定目标矿物的种类和含量。由于该技术的快速、低成本和高灵敏度等优点,已经被广泛应用于蚀变矿物填图工作中,指导矿产勘查工作。应用短波红外光谱技术进行勘查工作已经在冈底斯成矿带被广泛应用,例如西藏
研究背景脓毒症患者常会继发急性肾损伤(acute kidney injury,AKI)。缺血再灌注损伤、炎症免疫紊乱及肾小管损伤是其重要的发病机制。有研究显示NOD(nucleotide binding olig
病毒感染是威胁人类健康和生存最危险的因素之一,其不断变异的特性以及新型未知病毒的出现是现代医学和生命科学所面临的巨大挑战。在病毒感染机体时,机体中的模式识别受体识
本文对单目标连续跟踪系统进行了研究,尝试将单机跟踪算法扩展到多机连续跟踪的情境中。通过将改进的视角变形技术引入跟踪系统,本文首先实现并改进了两种典型的判别式跟踪算
心血管疾病是危害全球人类健康的头号杀手,具有高发病率、高死亡率、高复发率和低龄化的特点,迫切需要建立新方法、开发新技术,研发高效创新药物以实现心血管疾病的有效防治
[目的]构建尿酸酶基因缺失大鼠,并对其进行生物学评价、表型鉴定及分子鉴定,为高尿酸血症和痛风研究及其新药研发提供一种稳定且经济的模型动物。[方法]1、尿酸酶基因缺失大
许多量子技术,如量子密钥分发、量子隐形传态、量子密集编码等,基于量子态的量子相干性、量子纠缠等特征,这些特征与量子态的量子性有密切联系。研究量子态的量子性及经典性对于推动量子技术的发展具有重要的理论意义和应用价值。首先,研究了中间多次测量对存在退相位阻尼和外界驱动的量子比特系统量子性的影响。分别考虑均匀和随机时间间隔序列两种情形,量子性用量子见证Wq定量度量。数值结果表明,当中间测量次数N为数十次