论文部分内容阅读
特征描述作为上下文推理预测的先行步骤,它对原始数据进行一定的语义抽象并为后续推理预测模型提供直接的输入数据,所描述的特征样本数据的优劣将直接影响到最终推理预测的结果。虽然目前已有许多关于特征描述方法的研究,但都是针对图像识别、音频识别等特定应用领域,智慧交通场景下具有时间敏感性的多源异构时空数据的相关研究尚且较为欠缺。因此依托于智慧交通场景的上述特性,尝试对出租车搭乘量进行预测并由此展开特征描述方法的研究是十分有必要的。 通过对出租车搭乘量的时序规律进行分析以及充分考虑到交通场景下的时间敏感性,提出了一种能够生成特征样本数据的特征描述方法,这种特征描述方法能够将时序预测问题转换为机器学习中的监督学习问题,从而提供一种普适的预测方案。首先,从时序角度出发考虑时效趋势特征、时效周期特征以及全局周期特征,其中全局周期特征需要进行规范化的压缩描述;随后,考虑即时天气信息,将参考时间与预测时间在天气状况上的相似度作为特征变量用于描述即时特征;最后,将时序特征与即时特征有机结合,总结出完整的特征描述方法。 在珠海市出租车真实轨迹数据上,按照特征描述方法生成对应特征样本并利用脊回归模型进行预测实验,以预测的性能指标作为特征描述方法有效性的反馈,实验在测试集上的可决系数达到97%以上。进一步地,针对性地组合不同类别特征并进行各自的回归预测实验,从而对比并分析不同类别特征在预测时不同作用。