基于Hadoop的图片地理定位研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:windFWF1992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和互联网的发展,图片分享网站逐渐兴起。由于用户的广泛参与,图片分享网站中存储了海量的多媒体信息,其中有大量的图片、文本标签和用户信息,部分图片还具有GPS坐标,文本标签也通常含有地理位置描述信息。而与用户相关的GPS坐标具有很重要的研究价值,基于地理位置的搜索也逐渐流行,因此具有地理位置的图片有着广泛的应用前景。海量的具有地理位置的图片数据能提供有价值的信息,但具有准确地理位置的图片在网络图片中占得比例很低,人工标注的地理位置又往往不准确,因此需要利用已有的具有准确地理位置的图片确定其它图片的地理位置。同时,海量图片数据的处理需求对图片处理应用的数据存储与处理能力提出了更高的要求,依靠传统的数据处理技术已经不能满足大量数据的处理要求。云计算的快速崛起为图片处理应用提供了新的选择。本文在分析国内外研究背景和现状的基础上,研究了基于Hadoop的图片文件存储方案,深入了解和分析了Hadoop在处理小文件时存在的问题以及现有的解决方案,通过采用文件合并的方式优化了图片小文件的存储,并提出了一种改进的图片存储方案,设计了相应的存储访问接口。本文还分析了基于文本标签和基于内容的图片地理定位方案,研究了方案中用到的GPS坐标聚类、文本标签分类、图片特征提取及相似度计算等关键技术,并提出了一种基于Hadoop的改进的图片地理定位方案,同时结合Java编程语言、SQL Server2012数据库技术和百度地图API实现了基于Hadoop的图片地理定位系统。改进后的图片文件存储方案支持文件的合并和追加操作,极大地方便了图片文件的管理和处理,改进后的图片地理定位方案利用GPS坐标聚类和文本标签分类技术划分图片区域,同时将文本标签相似度与图片相似度相结合,有效地利用了图片及其文本标签信息。本文的实验结果表明,改进的图片文件存储方案具有较好的存储访问性能,改进的图片地理定位方案具有相对较高的准确率,系统运行也达到了预期的效果。
其他文献
司法行政化,即以行政的目的、构造、方法、机理及效果取代司法自身的内容,形成以行政方式操作的司法。法院司法运作的全过程均带有行政化色彩,表现为司法目的和价值的行政化
研究目的:促进开发区土地的合理利用,为中国开发区土地经济效益评价提供理论依据。研究方法:模糊测度和模糊积分方法。研究结果:开发区土地经济效益评价指标之间不具有独立性
我国《刑事诉讼法》对未成年人刑事案件不公开审理制度予以了规定。其时点理应以"犯罪时"(即"行为时")为准,而最高人民法院2001年的相关司法解释却将其错误地确定为以"审理时
等几何分析方法采用非均匀有理B样条形函数进行结构模型描述和计算分析,可以消除几何建模误差和传统有限元质量矩阵中负元素的影响,有效提高结构振动频率的计算精度。本文在
著各黑人女作托尼·莫莫里森在其第二部小说《秀拉》中塑造了一个与黑人文学传统截然不同的反叛者形象。小说主人公秀拉一味追寻自我,从而使这部小说通常为女性主义加以解读
采用文献资料法、录像观察统计法、数理统计法、比较分析法对小威廉姆斯与海宁在不同场地对阵时发球阶段技战术运用的特点进行对比分析.结果发现:在平分区小威廉姆斯外角的使
研究目的:掌握国家基本农田保护示范区建设进展情况,总结各地的经验做法,为当前高标准基本农田建设特别是高标准基本农田建设示范县提供参考。研究方法:函调法和政策分析法。
自2008年国际金融危机爆发以来,人民币国际化问题备受国内外关注。中国当局把握有利时机,将人民币国际化提高到战略高度进行考虑,并采取了一系列积极措施来促进人民币国际化
韩礼德(1985/1994/2000)认为语言具有三大元功能:概念功能,人际功能和语篇功能。人际功能是指表现人际关系的功能,主要通过语气系统和情态系统来实现。如果在人际意义中出现人
从经济学的角度出发,城市化是在空间体系下的一种经济转化过程。它是一个由以传统农业、手工业为主的农村社会逐步走向以高效现代的工业和服务业为主的城市社会的过程,这个过