多源异构位置数据的质量评估研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:m1598745
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的信息化进程不断加快、感知技术和计算环境的不断成熟,以及人民生活水平的不断提高,民用GPS等定位设备在车载以及移动终端上得到广泛使用,基于位置的大数据呈现爆炸式增长,由地理数据、车辆GPS轨迹、手机定位数据和用户“签到”记录等所构成的多源位置数据已成为感知人类社群活动规律、构建智慧城市的重要战略性资源。但是,目前位置数据来源广、种类多、表现形式多样、更新快、数据量大,产生的低质量问题不可忽视,由于位置数据主要来源于各类传感器、视频监控、移动终端、浮动车GPS系统等,数据的采集过程和传输过程易受到信号传播、移动终端设备、天气等一系列因素的影响,采集到的数据会产生数据丢失、无效、错误、乒乓现象、漂移现象等众多质量问题。而现有位置数据质量的研究多针对单源数据如GPS轨迹数据的研究,对其它来源的位置数据质量评估研究较少,且评估方法比较单一,多采用层次分析法。本文以多源位置数据的质量为研究对象,对多源位置数据进行了系统的质量评估。首先,进行多源数据采集,包括出租车GPS轨迹数据、新浪微博签到数据、相关联的POI位置数据和移动手机定位数据。其次,分析梳理多源位置数据存在的问题,综合考虑各位置数据的应用需求,提出相应的评估指标,构建出通用的多源位置数据质量测度框架。再次,确定每个质量指标的评估模型,并提出基于G1法和反熵权法相结合的综合评估方法。最后,将我们提出的多源位置数据质量测度框架运用到实际的多源位置数据的质量评估中,分析收集的多源位置数据的质量所属层次,验证了本文提出的质量测度框架、评估模型及方法的可行性。本文提出的质量测度框架兼顾了位置数据中所面临的各种质量问题,具有适用性,为后续位置数据的质量研究提供了参考依据。同时,本文的研究也扩展了大数据质量研究的领域,具有很好的理论意义和实用价值。
其他文献
随着四环素(TC)越来越广泛的使用于畜牧业和水产品养殖业,残留的四环素对环境造成了严重的危害。本论文以多壁碳纳米管作为吸附剂去除环境水体中的四环素,确定了吸附的最佳条
背景:失语症(Aphasia)是脑卒中最常见的合并症之一,目前针对脑卒中后失语症(Post-stroke Aphasia,PSA)的治疗方法多种多样,但临床主要倾向于综合治疗方案为主。在常规内科基
民国时期是中国历史上特殊的转型时期,结束了漫长的封建专制社会,在有识之士的积极探索和西学东渐的影响下,五四文学运动和新文化运动促进了中国历史上“儿童的发现”。本研究在这一历史背景下,依托《申报》和《大公报》儿童特刊分析民国“黄金十年”的儿童观,试图呈现当时更为全面的儿童观面貌。本研究采用内容分析法和文本分析法相结合的研究方法,在详细描述《申报》和《大公报》儿童特刊发展历程、编辑、作者群体及报纸立场
目的:研究cyclin E、p21WAF1/CIP1和MMP-2蛋白在甲状腺癌中的表达情况,及其与甲状腺癌发生、发展的关系。方法:采用免疫组织化学LSAB法对47例甲状腺癌进行免疫组化检测,取17
目的 检测肾细胞癌组织中内皮素-1(Endothelin-1,ET-1)及其受体的表达情况,了解其与肿瘤细胞凋亡、增殖的关系,探讨ET-1对肾癌影响的可能机制。 方法 采用免疫组化SABC法
现在的经济全球化正在经历一个新的发展阶段,通信技术的发展日新月异,通信设备市场需求也随之不断增加,企业之间的竞争亦越来越激烈,技术创新能力已经成为现代企业最重要的核
<正>1技术背景明胶是一种从动物的结缔组织(皮和骨)中提取的蛋白质。明胶产业有一百多年的历史,骨明胶生产企业一直沿用传统碱法工艺从骨中制取明胶。明胶不仅是照相材料最基
异构网技术是下一代移动网络的关键技术之一。由于在传统的蜂窝网络中引入了不同类型的小功率节点,异构网络的拓扑结构和干扰关系都相较于蜂窝网络变得更为复杂,仅依托传统方
随着数据的爆炸性增长,由于网络和软硬件故障等因素,数据在存储时可能会有错误或者漏存等情况。这些缺失数据、错误数据可能会导致数据分析、挖掘结果的偏差,甚至造成很大的决策失误,因而数据质量问题被越来越多的专家和学者所重视。目前,学术界与业界对数据质量方面的研究已经提出了不少方法,但还是缺少定制化、面向具体领域的数据质量量化研究方法。本文的项目背景是某机构需要一个定制化、面向特定领域的数据质量量化分析评
运用紫外-可见光谱技术以及结合平行因子分析法的三维荧光光谱(EEM-PARAFAC)技术,对周村水库秋末同温混合初期的沉积物间隙水中溶解性有机物(DOM)的光谱特征进行分析.结果表