基于大规模社交媒体挖掘的景点识别

被引量 : 0次 | 上传用户:haq1227
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着社交网站的兴起和数字摄影设备的普及,社交旅游系统异军突起。不同于传统旅游系统,它们的景点图片来源于社交网络,比如Flickr和Panoramio。社交网站的图片(社交媒体)一般携带丰富的上下文信息,包括文本标签、GPS、时间和相机参数。这些信息被应用于景点的自动识别算法中。虽然社交网络共享的景点图片易于获取,然而自动从海量的社交媒体中得到准确的景点图片集合并非易事。首先是图片检索的准确率较低。其次,构建一个世界级的景点识别,浏览算法的高消耗问题,目前大规模媒体计算还无法解决。本文研究了大规模社交媒体挖掘的若干算法,并应用于景点识别和社交旅游系统的开发中。基于大规模社交媒体挖掘,算法能自动地基于社交网站内容识别景点,并可视化。从而构建一个世界级别的景点图片数据库。首先从文本类社交网络Wikitravel提取出1000个景点的信息,并通过地理信息数据库,匹配景点的GPS。其次,开发了一个海量图片检索的框架。框架首先是基于GPS的图片检索,并从返回结果所携带的文本标签集提取了5000个文本主题。框架其次是执行基于文本主题关键字的图片检索。共检索了约800万张的图片。本文接着对数据库的语义断层,文本标签和GPS噪声情况进行了分析,分析结果作为开发图片GPS标注方法和相机姿态估计算法的现实依据。基于获得的GPS噪声情况对图片数据库进行地理标注和地理信息矫正,从而得到精确描述景点地理内容的约500万张级别的可视化数据集。通过单一景点内图像多特征聚类,得到每个景点图片聚类结果,并用高效的词汇树索引图像的SIFT特征。每个类中,用8点算法估计出相机姿态,根据图片的二维经纬度向量,配准到Google Maps上。从而提供景点多视角浏览功能。由于词汇树的高效性,在应用系统中可以快速返回指定视角的图片。本文用数据可视化算法和用户评估方式对算法进行了评估。算法估计出的相机姿态,从ECEF参考的可视化的结果来看,基本还原了图片拍摄的位置和角度。用户评估表明,算法的准确率和查全率满足用户需求。
其他文献
宁都电视台属高山广播电视发射台,属山区雷电多发地带,根据每年雷害事故报告分析,通过采用外部直击雷防护、屏蔽接地、机房等电位连接、对线路安装相应的电涌保护器(SPD)等方
榜样是社会主义核心价值观的人格化身,是社会主义核心价值观与大学生日常学习生活间沟通的桥梁。榜样教育是高校开展思想政治教育的重要方式,但随着经济社会的发展变化,近年
光纤通道(FC, Fiber channel)协议作为一种高速串行数据传输,由于延时低、速率快、带宽高和可靠的数据传输等特点,在存储区域网络中得到了广泛的应用。随着航空电子网络的逐
<正>中老年人暴露于紫外光、药物和化学品,或者由于患某些疾病导致肌肤过度色素沉着,对心理和生理都产生严重影响。过度色素沉着还可能是由于外伤、化学换肤术、激光疗法或粉
面对日益激烈的顾客服务竞争以及物流管理中日益暴露的矛盾,为更好地了解企业自身经营状况,评估企业在行业内所处的位置,更好地评价企业业绩,更好地分析原因,更好地进行决策
浙江省作为国内经济发达省份,酒店行业的发展蒸蒸日上,一直在国内名列前茅,但也存在诸多问题和不足,在采购成本管理方面尤为突出。本文以CW酒店为典型,通过对这一只麻雀的解
实现中华民族伟大复兴的中国梦,既是100多年来中华仁人志士的梦想和追求,也是近代以来中华民族的共同期盼。作为最具活力和创新精神的特殊社会群体,当代大学生是实现中国梦的
采用基于亮度的阈值分割算法对G-B灰度图像进行分割,采用4连通像素标记法对果实目标进行标记,提取质心、面积、外接矩形、切断点等特征。采用平面标定方法,建立摄像机矫正数
中国零售业的"走出去"步伐远远落后于中国制造业,零售业对外直接投资项目少、金额小,与中国贸易大国的地位不相符,不利于改变我国在全球价值链所处的被动局面和服务贸易失衡
<正>如何读懂年轻人的世界?如何用走心内容和年轻人进行灵魂沟通?这是所有品牌无法回避的课题。近年来,随着主力消费群从"80后"向"90后""00后"逐渐延伸,品牌年轻化已成为众多