基于多元线性回归模型的缺失浮动车数据填充研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bhf10116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实生活中,数据缺失问题是很广泛存在的,无论是在交通方面还是在社会经济研究、生物医药研究等诸多领域中数据缺失现象都是不可避免的。因为数据存在缺失,不单会增加分析研究任务的复杂程度,这样既会大大降低了统计工作的效率,又会导致统计分析结果的重大偏差。所以,为了得到较为完整的数据,采用数理统计的方法对缺失的数据进行填充,是数据处理中不可缺少的重要步骤。本文就是以浮动车数据为例,来研究缺失数据的填充方法。本文研究的主要内容是,将深圳市路网与浮动车数据相结合,得到路网中存在的缺失数据,为了填充缺失部分提出多元线性回归模型,尽可能使得数据覆盖路网范围更广,形成路况发布指南,方便人民出行。具体如下:考虑到交通数据的时空相关性,分析在多尺度下路网的空间相关性,得到缺失数据插补的空间相关因素,同时分析浮动车数据的时间相关性,确定了时间窗的尺度,为后文插补缺失数据模型奠定基础。结合时空相关性,应用多元线性回归模型。首先仅结合空间相关性建立模型,通过选取训练数据做验证分析,效果不好,精度较低;为了提高精度引入时间相关性因素建立模型,进行对比验证,得到在结合时空关系的多元线性回归模型填充缺失数据更具有普遍适用性,并总结该模型适用的四种情况,同时根据课题组成员针对热点区域的研究得到的三个热点区域,分别进行遍历填充。最后是实证分析部分。本文通过对热点区域福田区为例,选取训练数据对模型进行实证校验,通过实证数据校正模型的准确性,然后对实际道路缺失的数据进行填充并与该缺失部分历史存在数据做佐证,进行路况发布。本文的研究能够得到一个结合时空相关性填充缺失数据的可靠模型。
其他文献
距离“双一流”大学名单的公布已有将近两年的时间,作为一种新的评价导向,双一流建设对大学评价体系必然会带来极大影响。近日,中国科教评价研究院组织了2019年中国大学及学
<正>2012年5月14日,中央电视台开播美食类纪录片《舌尖上的中国》,影片"通过中华美食的多个侧面",展现"中国各地的美食生态"。然而谁都没有想到,自开播以来,其平均收视率超过
朱马拜·比拉勒是当代新疆著名的哈萨克族作家,其文学创作深受本民族传统文化与汉文化的双重滋养,形成了多元文化融合语境下特有的思维特质与创作心理。对其作品的研究,多数
抗生素的滥用导致耐药性细菌的出现并泛滥,细菌的耐药性及其耐药基因可通过食物链从动物传播给人类,这对人类的健康造成直接威胁。本研究从广州市六家超市及三家农贸市场中采集
在元代大一统的时代中,统治者为了巩固国家的安定需要,兴学校,重儒学,加速了元代西域蒙古色目文人的华化过程。中华民族文化的强大魅力吸引了众多爱慕华学的少数民族;同时中原文化
本文结合公共服务理论和党的十八大报告,重点阐述了新形势下我国电视媒体依托新闻报道向社会提供公共服务的基本目标、创新空间和现实路径。本文认为,我国电视公共服务的基本
"诗意地栖居"是人的一种幸福美好的生活方式。泰戈尔作为近代举世闻名的大诗人,亚洲首位"诺贝尔文学奖"的获得者,其作品广受读者青睐,其中《飞鸟集》更是对中国影响深远。泰
世界万物都在变换之中,从远古的群体部落生活,到一家一户部落疏远,再到一对一、多对一以及多对多的重新部落化;从坐商行贾叫卖时期的口语时代,到"一字千金"的印刷时期,再到如
目的:探究影响会阴侧切后严重感染的因素和护理方法。方法:回顾性分析我院妇产科76例会阴侧切后严重感染产妇的临床护理资料,分两组,即生理妊娠组(38例)和病理妊娠组(38例),
概述了NO分子在植物体内的来源,在信号转导、生物和非生物胁迫响应等过程中作用,以及NO与植物中其他信号分子的关系。