图像内容识别技术和对比挖掘在网站分析中的应用研究

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:ntfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,随着生活质量提高,人们旅行比以往任何时候都多,对酒店需求也随之增加。信息技术的蓬勃发展使得社交网站为酒店选择提供了便利。但是,由于无法对网站上展示的酒店进行实地考察,消费者如何通过对比以选择满足自身需求的酒店成为广泛关注的问题。而网站上展示的图像在提供视觉享受的同时,为这一问题提供了很好的解决途径,因为图像能反映酒店实际情况。但是随着社交网站上的图像越来越多,图像信息负载问题也越来越严重,这对消费者进行人工对比选择造成了很大的困扰。针对上述问题,本文经过大量调研,发现在国内外社交网站的相关研究中,大多数人倾向于针对评论或者评分进行研究,然而图像内容的对比挖掘相关研究较少,使得图像信息无法得到充分利用。为实现对比两组大规模图像数据集并得到之间的差异,本文首先利用深度学习技术识别图像中的实体并得到标签。随后为消减实体相似性导致的信息冗余对对比分析产生的不利影响,采用:1)文本分析中词向量转化的方法,将实体标签向量化;2)无需指定类别数目的层次聚类算法进行标签向量的聚类。最后利用FP-Growth算法对聚类后的向量集挖掘频繁项集并进行对比挖掘,识别两组图像数据集中的对比模式。通过识别出的对比模式,分析两组图像数据集之间的差异。本文将上述方法应用于国内外著名社交网站:猫途鹰、Co-worker、Pinterest等中,得到相关对比模式,这些对比模式可为消费者和商家在进行消费选择和制定营销策略时提供可靠参考信息。同时本文所提出的基于深度学习的图像处理和对比挖掘的方法也可以应用于其他各类社交网站,来帮助消费者和商家提供行之有效的消费决策和营销策略。
其他文献
随着科学技术的进步和社会生活水平的提升,人们对车辆平顺性和操稳性的需求也在不断提高。传统被动悬架不能兼顾车辆舒适性和操稳性难以满足人们的需求,而主动悬架受到高能耗
合理构建具有特定形貌的含有前过渡金属(Mo、W)和后过渡金属(Co、Ni、Fe)的前驱体是获得双过渡金属碳(氮)化物的关键。多金属氧簇化合物(多酸)(Polyoxometalates,POMs)是由Mo(W)等前过渡
在传统化石能源短缺与环境污染问题日益严重的今天,发展绿色环保交通成为当今的热门研究课题。在这个时代背景下,电动汽车以其低能耗、低污染的特点成为解决环境和交通问题的
风能作为一种蕴藏丰富的清洁可再生能源,近年来发展迅猛。叶片是风电机组吸收能量的关键部件,具有结构扁平、轻质、柔性迎风的叶片在随机变载荷的风力作用以及强阵风的瞬时冲
锂离子电池是强热电化学耦合体系,热物性参数是锂离子电池热特性的重要表征参数。然而,锂离子电池多层湿式结构为其热物性参数测量提出了挑战,快速、精确测量其热物性参数需
目的探讨Ⅰ期肝细胞肝癌微血管侵犯(MVI)的相关因素。方法采用回顾分析方法。收集重庆医科大学肝胆外科2017年1月至2019年2月收治的Ⅰ期肝细胞肝癌患者共60例。收集入组病例的一般资料、实验室指标、影像学数据及术后病理检查结果,依据病理结果将患者分为MVI阳性组和MVI阴性组,采用t检验、Mann-Whitney U检验、卡方检验或Fisher精确检验比较两组患者的术前资料。采用ROC曲线最大约
交通网络是是一个国家的社会发展的驱动力,铁路干线作为国民经济的大动脉越来越展现其在经济社会活动中的重要性。而隧道作为连通线路的重要节点日益突出其重要性。截至2018
促分裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)级联信号途径对病原真菌生长、形态建成、侵染结构分化、次生代谢、致病性及渗透胁迫响应等多种生理功能具有调节作用,其调控作用因病原物种类、互作系统而异。为进一步阐明Hog1与Slt2-MAP激酶是否参与及如何调控Alternaria alternata响应梨果表皮疏水性和蜡质信号从而启动侵染的过程,本试验
[目 的]探讨血浆同型半胱氨酸(Hcy)、白细胞介素-6(IL-6)水平与冠心病(CHD)的相关性,并分析血浆Hcy、IL-6水平对CHD的严重程度、冠脉病变支数及狭窄程度的预测价值。[方法]选
目前中国建设行业蓬勃发展,不仅在楼房建设中常常会产生许多废弃混凝土,在道路建设中尤其是路面建设中常会消耗很多优质的碎石。为了有效解决天然集料紧缺和建筑垃圾过量且难