基于深度学习的酒店用户生成图片物体识别优化研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:libra_15
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电子商务以及互联网技术快速发展的今天,越来越多的人选择通过网络进行消费,并愿意在网络平台上分享自己对商品或服务使用体验的评论。通过对在线评论的挖掘和分析可以为其他消费者提供多方位的产品使用体验信息,帮助潜在消费者做出更好的购买决策;同时也可以使商家进一步了解自身产品的优势和不足,从而优化其管理策略、改进产品或服务质量、强化自身竞争优势。目前,在线评论相关的研究引起国内外学者们的广泛关注,对酒店和旅游领域的在线评论研究也逐渐深入,但已有研究工作主要集中在评论的文本内容、文本情感倾向、评论者等级等方面的分析。用户生成图片是在线评论的重要组成部分,图片中包含的物体可以充分展示产品和服务的特点,同时可以体现用户对产品属性的关注程度,图片中所包含的物体对进一步研究在线评论具有重要价值。然而,当前对图片评论中所包含的物体信息的挖掘尚不多见,且主要以内容分析法和符号学分析法为主,这些方法不能为酒店场景下的图片提供有效的特征提取方法。因此,本文在深度学习目标检测算法Faster R-CNN的基础上,结合酒店用户生成图片应用场景的特点,分析Faster R-CNN在此场景下识别准确率低的原因,提出有针对性地优化措施,满足酒店用户生成图片应用场景下的检测需求。本文结合酒店用户生成图片中的目标物体具有种类繁多、形状大小多变、样本数量不平衡等特点,提出适合酒店场景的更加高效的目标检测模型Faster R-CNN-FFS。具体研究工作包括:首先本文以从“去哪儿”、“携程”等电子商务平台的用户生成评论中获取的图片数据作为数据支撑,对酒店用户生成图片数据集的制作,共标注了八类物体,14901张图片。然后,针对在复杂无约束的酒店场景下,如何有效缓解对多目标物体检测和对小尺寸目标识别时出现的误检、漏检等问题,本文对Faster R-CNN模型的特征提取网络结构进行改进,提出将特征融合结构引入到Faster R-CNN中进行特征提取。接着,针对训练过程中正样本、负样本以及困难样本、简单样本之间的比例失衡的问题,提出使用Focal Loss损失函数来替代原模型中的交叉熵损失函数。其次,针对现有模型中基于NMS算法的候选框筛选机制较为简单直接,导致漏选得分较低但是可以正确表示另一个物体的候选区域。本文使用Soft-NMS,对Faster R-CNN的非极大值抑制算法进行优化,挑选出质量更好的潜在目标区域进行回归。最后,对本文所提出的Faster R-CNN-FFS模型进行验证,本文所提出的模型的识别效果具有显著提升,最终的mAP值达到了 69%。以上工作证明本文的研究工作充分考虑酒店领域用户生成图片目标物体检测的数据特点,有效解决了复杂无约束场景下的多目标识别问题。该研究结果为复杂场景下的目标物体检测研究提供的新思路,同时也为拓展基于多模态的结构化数据(评分)和非结构化数据(文本和图片)的在线评论分析研究提供了有效的理论支持,进一步丰富了用户生成内容的特征,为深入研究酒店在线评论的工作提供有效支撑,对酒店优化服务和酒店管理决策具有重要参考价值。
其他文献
排污权交易试点政策是中国尝试通过市场配置资源的方式来解决环境问题的一次重要实践。本文基于2002年—2013年的中国规模以上工业企业数据,利用三重差分方法,从影响机制和异质性的角度,对排污权交易政策对试点地区企业绩效的影响展开研究。研究结果发现:(1)排污权交易政策对企业利润率产生了显著的正向影响,但对企业全要素生产率产生了显著的负向影响。(2)在此基础上,本文进一步通过三步验证法对排污权交易政策
新古典经济学自上个世纪以来一直在经济学中保持着统治地位,以至于其被“尊称”主流经济学。而在主流经济学内部,研究方法的地位也有着很大的差异,以数理逻辑推导为首的研究方法随着技术的不断进步也被推崇为“最科学”的方法,掌握着绝对话语权。但正如实验方法在自然科学中“大器晚成”的命运一样,经济学中的实验方法也经历了从被边缘化到逐渐被经济学界接受的发展过程。这一态度转变的原因之一可以归结于实验方法在主流经济学
目前,创业已成为全民关注的焦点。现在正是全民创业、万众创新的时代,但真正成功的却寥寥无几,新创企业如雨后春笋般出现,消失的速度也是令人结舌,创业成功率不到30%,因此新创企业的生存问题是创业者们首要关注的焦点。而创业是否成功,与创业机会和创业资源密切相关。在创业研究中,学者们总是从机会或者资源的单一视角探究各自对创业成功的影响因素,而在实际的创业活动中,创业机会和创业资源是密不可分的,机会开发是基
流动质押是一种动态质押,其特点就是质押物在质权设立后可以按照约定发生出旧补新的动态置换,但质押物的置换始终处于约定的最低价值之上,且质押物与非质押物通过物理方法隔离区分符合特定化的要求,应当认可其具有物权效力。流动质押担保具有强大的融资功能,出质人在为债权人设定担保的同时又可以盘活库存。又因监管人的介入,在发挥融资担保功能的同时又保障了流动质押的安全价值。实践中质权人通过监管协议将质押物委托给第三
自动驾驶汽车作为人工智能产品的一个典型代表,近年来获得了较为快速的发展,不少造车企业以及互联网企业向自动驾驶汽车领域进军,尤其是近些年来出现了自动驾驶汽车上路行使的新闻,如2017年7月,百度公司的董事长李彦宏乘坐百度公司研发的自动驾驶汽车在北京上路行使。自动驾驶汽车已经从科学幻想、实验室阶段开始步入公众生活之中,受到了越来越多的关注。尽管自动驾驶技术发展较快,但其仍然处于起步阶段,技术仍然并不十
融资租赁作为实体企业的一种新的融资方式,有其独特的优势即提供融资服务的同时,提供融物服务,这一独特优势使得它在我国产业转型升级中发挥越来越重要的作用,因此,该行业的发展越来越得到国家和地方的重视。但融资租赁在推动其他产业发展的同时,与此相反的是,它自身的发展面临较大问题。其自身资金来源严重依赖银行信贷且主要是短期信贷,但融资租赁项目一般期限都较长,因此,融资租赁业经营风险较大。另外,由于缺乏长期稳
自2013年12月中央城镇化工作会议公报中提出“让城市融入大自然,让居民望得见山、看得见水、记得住乡愁”以来,一句“记得住乡愁”,温柔了人心,激发了无数人的情感共振。随着经济和城市化进程的快速发展,人们的生活节奏在加快,越来越多的城市居民渴望离开城市,有的人也是为生活所迫,因此远在外乡的人们只能把远方活成故乡,“乡愁”便成为一种“追求”。乡愁,是思念故乡的忧愁心情,是人类共同的情感。而原生性的乡村
污染型经济的快速发展已影响了自然环境,既限制了经济长期发展,也不利于自然生态持续,转变发展方式成为了当前的迫切需要。在这样的背景下,中国开始推行绿色金融,以金融促环保,其中尤为突出的就是绿色信贷。绿色信贷作为一种污染防控的措施,主要通过信贷手段限制污染企业融资,进而影响其生产方式的转变,达到污染治理的主要目的。中国绿色信贷已开展数年,一些学者提出其存在政策法规不完善、体系制度不健全及环境信息披露不
随着利率市场化进程的加快,互联网金融的深入发展,银行业的开放程度日益提高,我国商业银行所面临的内部外部环境都较之于以前发生了巨大变化。存贷利差收窄、竞争的同质化增强等等现实的情况使得银行单纯依靠传统的业务获得收益变得愈发困难,故而银行转型促使自身实现多元化经营成为了行业发展的态势。在这一过程之中,一方面多元化的经营可能带来规模经济和范围经济,从而对银行的绩效水平产生积极的影响;另一方面,贯彻实行多
近年来,知识经济的到来使得我国高新技术企业面临着日益复杂的经营环境,企业要想在这样的环境中生存并立于不败之地,就必须调整其发展战略。现代企业生存之本——创新,就变得尤为重要。为了提升技术创新能力,选择国际化战略,日渐成为众多企业提升内部技术能力和创新成果的重要方式。然而伴随着公司国际化发展的大趋势,大部分国内企业往往只注重自身创新能力的提升,而缺乏对企业自身知识产权管理的关注,这导致了大量技术创新