基于随机森林算法的女西装推荐与试衣

来源 :东华大学 | 被引量 : 0次 | 上传用户:tianchaoguoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着线上服装消费潮流的盛行,各大电子商务平台每天都会产生大量的服装购买数据,由于用户数量以及服装种类的不断增多,用户数据的稀疏性、复杂性给服装推荐模型的优化造成了大量的阻碍。现有的服装推荐模型对数据缺失较为敏感、对数据集的容错率较低、对离散型数据的处理效果较差,且只能给用户提供与推荐结果相关的图文信息,用户无法进行试穿,这会降低用户的购物体验并产生大量遗憾消费。因此,顺应机器学习技术、大数据分析技术、人工智能技术与工业互联网协同技术的发展,研发集服装推荐与虚拟图像试衣为一体的智能化推荐模式,成为了服装推荐系统的发展趋势。为弥补现有服装推荐模型的不足,解决服装数据复杂、服装数据超载、推荐准确率较低、推荐结果单一等问题,以女西装为例做出以下研究:首先,综述了服装推荐技术的研究现状,提出了基于随机森林算法并集女西装风格量化、风格相似性推荐、推荐结果图像试衣为一体的推荐模型。详细介绍了随机森林算法、服装推荐技术与图像试衣技术的基础知识。其次,完成女西装特征体系构建并实现女西装风格量化。收集了京东网与淘宝网中关于女装的若干商品信息,结合文献分析与专家访谈将女西装的常见风格标签总结为商务、休闲、通勤、甜美与街头这5类,将女西装的特征总结为HSV色彩特征、款式特征、图案特征与装饰特征这4个模块,对各特征模块的内容进行分析,并对各特征的赋值方式以及取值标准进行了说明,完成推荐模型搭建的前期准备。然后,构建了女西装推荐模型并完成了试衣训练。根据8位专家打分与色彩提取,标记西装样本集,借助Relief-F算法计算特征重要性得分,进行特征优选并设计对比实验。通过随机森林算法为样本中的特征与风格标签建立关联,构建分类模型,通过决策树叶结点计算用户目标与样本间的相似度,进行样本排序并形成推荐列表。收集图像试衣训练样本,完成针对女西装的虚拟图像试衣模型再训练。本研究采用从电商平台中收集的250个女西装样本,结合试衣模型进行验证,在特征优选部分总结得到16个特征(色调、饱和度、明度、衣长、廓形、袖长、袖型、门襟、材质、纯色、文字、几何、自然、拼接、褶皱和明线)作为最优特征集。模型对于风格分类的准确率达到85.3%,对比未优选的特征集与其他分类器有显著提升。通过对于30位消费者的用户调研得到模型推荐的准确率为83.3%,推荐列表中不同结果与目标的相似性呈现递减的趋势。研究表明:基于随机森林算法构建的西装推荐系统能够基本满足顾客对款式推荐需求,能有效解决服装数据超载、服装数据复杂、推荐结果单一等问题,提高服装推荐准确率。
其他文献
2020年伊始,新冠疫情席卷全球,线上交流备受青睐,文本数据爆炸式增长。随着移动互联网的飞速发展和文本数据的海量积累,真实场景中的短文本分类需求变得愈加迫切。然而,在真实场景中,短文本分类同时面临标注数据不足、数据稀疏和不平衡分类三大挑战。现有研究又鲜有同时解决这三大挑战的有效方案。鉴于此,本文聚焦于短文本分类问题,主要完成了以下工作。在第一章,对短文本分类问题的研究背景、研究意义、相关研究现状,
学位
众所周知,人工智能现在已经成为生活和科学研究中难以绕开的主题。目前,设计能够面对复杂环境并在环境中做出良好决策的智能体是现代人工智能研究的基础。在控制科学领域,对传统单一对象的控制方法和理论已经愈发成熟。同时,随着被控对象的数量的增加,多智能体系统逐渐成为在控制领域一个研究的热点。与传统的单一对象控制不同,对多智能体系统的控制往往需要考虑智能体所处的环境对整个智能体系统的影响。不幸的是,在实际应用
学位
纺织产业是中国重要的支柱性产业,与民生大计息息相关。在以国内大循环为主要思路、国内与国际双循环互为促进的新型经济发展格局下,中国纺织业面临着先进制造技术新环境下可持续发展和高端发展的机遇和挑战,亟须实现产业的数字化、智能化转型升级。提升纺织产业整体的智能制造水平对实现中国“制造强国”的战略目标而言至关重要。然而,纺织企业在数字化转型的过程中,常因对企业原有发展路径的依赖以及数字基础设施不够完善,缺
学位
党的二十大报告指出,全面建设社会主义现代化国家,最艰巨最繁重的任务依然在农村,农村问题是最基础、最复杂、最急需解决的重大历史与现实问题。随着社会治理创新的推进和乡村治理问题的不断显现,仅靠政府这一单一主体显然无法应对复杂的治理环境,这种现实需求生成了建设乡镇社工站的独特历史逻辑和现实逻辑。同时,我国广东、湖南等地乡镇社工站的试点探索彰显出乡镇社工站参与基层社会治理、改善民生服务的突出优势。福建省民
学位
因为农业人口众多,耕地面积有限,我国农业一直以小农场为主的生产方式进行,但是随着人口老化的逐步加剧,同时伴随着城市化的推进,现在农业劳动力开始减少,未来中国粮食安全面临“谁来种地”和“如何种地”的挑战。解决这一问题的实现路径之一就是无人化农场技术。该文通过对上海市嘉定区无人化农场的技术实践,对无人化农场的概念、技术架构,以及基础设施、作业设备、数据监测系统和管控服务平台等关键技术进行系统阐述,对无
期刊
随着大数据时代的来临,深度学习技术的浪潮席卷了包括图像分类、语音识别、自动驾驶和内容推荐在内的多个应用领域。但是,数据量和神经网络模型复杂性的增加带来了巨量的计算开销,导致单机训练速度缓慢。基于参数服务器架构,在多个节点上分布式训练深度神经网络模型是一种行之有效的加速方法。由于神经网络模型训练的迭代性质,不同的计算节点之间需要频繁地进行通信以交换大量的数据,这就导致通信开销成为分布式训练中的关键瓶
学位
随着当今信息化时代的高度发展,信号检测技术无疑已成为了科学领域关注的重要热点。特别是在复杂背景下的信号检测中,传统的信号检测方法开始出现局限性,检测性能不能满足实际需求,故探索信号检测的前沿技术在信号处理领域显得愈来愈重要。作为数据信息提取、凝练的有力工具,矩阵信息几何(Matrix Information Geometry,MIG)理论已经在信号检测领域被应用,并取得不少成果,但其高时间复杂度和
学位
编译器模糊测试是一种对编译器的稳定性与安全性进行测试的技术。有效的模糊测试需要具有正确的词法和语法的测试用例,只有这些格式良好的测试用例才能通过编译器的解析阶段,从而对目标编译器深层次的代码部分展开测试。深度学习技术因其捕获复杂特征的能力以及较少地依赖专家工程的特点,近来逐渐被应用到模糊测试用例生成领域,这些方法通过学习编程语言的语言模型,从而在无需提供复杂的编程语言语法规范的条件下生成格式良好的
学位
随着自然语言处理技术的兴起,情感分析得到了广泛的研究。细粒度情感分析由于其分析对象更具体、更明确,成为近年来的研究热点。主流方法首先获取表征特定目标的句子嵌入层,然后将其馈送到各种经典神经网络以学习特征,最后通过分类器获得给定目标的情感极性。从CNN,LSTM,RAM,IAN到GNN的各种变体,研究人员挖掘各模型优势尝试对给定目标与其上下文之间的关系进行更好的建模。尽管已经取得了一些成果,但细粒度
学位
长期伏案工作会导致脊柱承重异常,椎间盘内压力不均衡,进而出现骨质增生或椎间盘纤维环破裂。同时,相关肌肉长期处于非协调受力状态,易致肌肉和韧带劳损,且肌肉肌力变化后会反向牵动骨骼弯曲,使不良姿势难以恢复。保持理想站坐姿,可维持脊柱承受压力较为均衡,避免不必要的损伤。市场上的矫姿产品可辅助人体保持良好姿势,矫正不良姿势,为探究其矫正效果及真实性,本文选购四款矫姿带,通过体表角度测量评价各款式的效果。(
学位