大数据时代下的众包数据的可视化方法

来源 :第六届全国地理信息科学博士生学术论坛 | 被引量 : 0次 | 上传用户:d34276
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  2006 年杰夫首次提出了众包的概念[1].指出众包是指将一个传统上由专门的代理(通常是雇员)来完成的任务以公开征求的方式外包给不特定的大众的做法.简单地说,众包是指将软件开发领域中开放源代码的方法应用到其他领域.众包概念提出后,其新颖的模式迅速引起了业界的广泛关注和讨论.众包(Crowdsourcing)地理数据[2],有时也称之为志愿者地理信息(VolunteeredGeographical Information,VGI)或个人位置数据(Personal Location Data),是指个人或拥有某种共同兴趣的团体等有意识或者无意识地记录下自己活动的位置或者发生在某些具体地点和时间的事件,并将这些信息通过地理坐标、文字、图片或者录像片段等格式分享在互联网中.这一类信息没有统一的质量规范、也没有统一的格式,但数据量巨大(2009 年全球达到至少1PB 级),并且每年以20%的速度增长.本文以微博签到数据为例来探究众包数据的可视化方法.目前成熟的可视化方法包括:文本信息可视化方法(如标签云[3]),Cartogram 可视化方法,聚类结果可视化方法,树图可视化方法.其中对于Cartogram 算法[4],它保持位置的相对正确,基于属性进行夸张变形,直观地传递某种特定信息.聚类结果可视是充分利用文本聚类结果的树形结构的层次特点以及文本之间的语义关系进行文档抽象布局[5];通过山峰模型形成等值线,进而构建主题图的可视化表现形式用以表现文本集合中的语义关系,也可通过K.means 聚类算法的并行化对其进行改进[6].树图可视化方法在表示多维信息时[7],节点的大小、形状、颜色、节点间连线的线型、粗细、曲直、长短(节点间的距离反映权值大小)都被用来表现相关信息.通过这些可视化方法的研究,可得到如某地所有景点的兴趣热点、兴趣冷点,或是预测、预警某地的突发情况,为大众的用户行为提供及时得当的信息.
其他文献
近十年中,三维GIS技术逐渐发展成熟,使三维空间的定量预测成为可能.传统找矿勘探工作积累的数据大多不能支持三维空间预测,传统矿床学研究也处于概念、定性研究阶段,因此,在三维空间实现隐伏矿体的定量、定位预测困难重重.如何将传统一维(文本记录)、二维(图件资料)数据加以综合利用,如何实现不同尺度的三维建模及立体填图,如何利用三维空间分析方法进行形态趋势分析及控矿地质因素提取,如何选择合理可信的成矿预测
全球范围内生态安全的形势越来越严峻,环境脆弱区的生态安全研究已经成为当前人们最关注的热点问题之一。而景观是区域生态环境管理的基础单元,景观安全是生态安全研究的重要内容,从景观层次进行生态恢复已被证明是可行的。最小累积阻力模型是判别建立生态安全格局的重要基础。东北农牧交错带位于我国北方农牧交错带的东部,是典型的生态环境脆弱区。本文以RS和GIS作为技术手段,基于景观生态学的基本理论和方法,采用最小累
对于城市不透水面的提取,Ridd发展了植被—不透水面—土壤(V-I-S)模型,这个模型假设每个象元都是由植被、不透水面和裸土组成的.(V-I-S)模型在城市不透水面的提取方面得到了大量的应用.Small(2001)提出了改进的V-I-S 模型,即植被—低反射率—高反射率(V-L-H)模型.他利用此模型对美国纽约的不透水面进行了提取.根据TM影像6个波段反射率数据及4个端元的反射率,利用LSMA,S
本文利用苏打盐渍土壤的PH、EC与OLI影像波段反射率进行相关分析并建立回归模型,探索了利用多光谱影像估算的该类型土壤盐碱程度的可行性。本研究中土壤样本采集自乌裕尔河,双阳河流域(位于松嫩平原中部),采集时根据不同的土壤类型和盐碱程度设置采样点。其中183个土壤样品于实验室制成风干土样,采用SVC-HR1024i光谱仪获取其光谱数据,并通过化学分析,测得土壤PH、EC值和八大离子含量。另外获取了4
本文以1990年、1995年、2000年、2005年4期覆盖哈大齐工业走廊的TM遥感影像为数据源,对其进行人机交互解译得出哈大齐工业走廊的土地覆被类型图。以贯穿哈尔滨、大庆、齐齐哈尔市区的铁路线为中心轴,分别以30000米、60000米、90000米、12000米为半径建立四个缓冲区。选择类别尺度上的景观指数分别对四个缓冲区的景观格局进行分析,选取适宜的阈值确定出哈大齐工业走廊对周边生态环境的影响
维多利亚湖是世界第二大淡水湖,也是非洲最大的淡水湖.它横跨三个国家:肯尼亚(6%)、乌干达(43%)和坦桑尼亚(51%).维多利亚湖养育了周边约3000 万的人口,为当地的居民提供了农业、工业、旅游、交通等用水,对肯尼亚、乌干达和坦桑尼亚三个国家乃至整个非洲的社会经济发展和人民生活水平的提高都具有非常重要的意义.利用卫星遥感影像,结合激光高度计、雷达高度计等数据,可以动态监测的湖泊的表面面积、水位
雪灾是草原区冬春季最主要的气象灾害之一.由于雪灾持续时间长,影响范围广,给当地农牧民的生命财产造成了严重的损失,直接威胁和制约了当地畜牧业的发展.微波数据由于能够全天候观测积雪,能够穿透大部分积雪层探测到雪深信息,因此在雪灾遥感监测中必不可少.积雪深度是草原雪灾防灾减灾管理中的一个重要参数,对于确定雪灾的范围和程度具有重要的意义.目前积雪深度反演模型大多基于统计学的原理,采用地面实测数据与物理模型
影像分割是面向对象影像分析的基础,分割结果对后续的地物识别和提取都有重要的影响.建筑物作为城市遥感影像中的主要类别,其分割尺度的选择一直是高分辨率遥感应用的一个难点.本文以高分辨率影像城市建筑物为例,通过研究其多尺度特征及影像特征,探讨了一种基于多尺度特征分析的最优分割尺度计算方法.通过对目标区域进行不同尺度序列的影像分割,统计分析建筑物基元内部的多种特征的类内均值方差,将各特征因子方差的平均值作
洞庭湖为中国五大淡水湖之一,中国第二大淡水湖,是长江中游重要吞吐湖泊,处于湖南境内,位于湖南省东北部,湖区面积2820平方公里,天然湖面4040平方公里,另有内湖1200平方公里.洞庭湖南纳湘、资、沅、澧四水汇入,北由东面的岳阳城陵矶注入长江,号称"八百里洞庭""鱼米之乡",曾经是中国第一大淡水湖.首先,对影像进行预处理。对所选取的两景影像进行拼接,并对拼接后的影像进行了羽化处理,控制了合并后两景
气候变化将会对水文循环过程产生重大影响.气温、降水和蒸散发是重要的气候要素,其未来的变化趋势预测对于评估未来气候变化影响具有重要意义.水文模型用数学方法对自然界水文循环过程进行模拟和描述,可以帮助人们理解水文规律和水文过程,是解决未来气候变化情景下流域水文变化信息的主要手段和工具.本文分别以北京地区和北京西北延庆县妨水河流域为研究对象,采用高温室气体排放情景(A2情景)和低温室气体排放情景(B2情