基于时间敏感的多源异构数据的特征描述及预测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:huweiguangkaka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征描述作为上下文推理预测的先行步骤,它对原始数据进行一定的语义抽象并为后续推理预测模型提供直接的输入数据,所描述的特征样本数据的优劣将直接影响到最终推理预测的结果。虽然目前已有许多关于特征描述方法的研究,但都是针对图像识别、音频识别等特定应用领域,智慧交通场景下具有时间敏感性的多源异构时空数据的相关研究尚且较为欠缺。因此依托于智慧交通场景的上述特性,尝试对出租车搭乘量进行预测并由此展开特征描述方法的研究是十分有必要的。  通过对出租车搭乘量的时序规律进行分析以及充分考虑到交通场景下的时间敏感性,提出了一种能够生成特征样本数据的特征描述方法,这种特征描述方法能够将时序预测问题转换为机器学习中的监督学习问题,从而提供一种普适的预测方案。首先,从时序角度出发考虑时效趋势特征、时效周期特征以及全局周期特征,其中全局周期特征需要进行规范化的压缩描述;随后,考虑即时天气信息,将参考时间与预测时间在天气状况上的相似度作为特征变量用于描述即时特征;最后,将时序特征与即时特征有机结合,总结出完整的特征描述方法。  在珠海市出租车真实轨迹数据上,按照特征描述方法生成对应特征样本并利用脊回归模型进行预测实验,以预测的性能指标作为特征描述方法有效性的反馈,实验在测试集上的可决系数达到97%以上。进一步地,针对性地组合不同类别特征并进行各自的回归预测实验,从而对比并分析不同类别特征在预测时不同作用。
其他文献
从当前的实际情况出发,经过对有关报业集团新闻数据管理系统的考察和分析,确立了宁夏日报报业集团新闻数据管理系统的具体要实现的功能。并阐述新闻管理系统的结构设计和功能设
本文为求解TSP问题设计了一种改进的遗传算法。在学习和研究过程中,了解到遗传算法在求解TSP问题的有效性,且影响遗传算法性能的参数主要有初始种群的质量、群体的大小、交叉概
电力系统图形编辑器是电力系统应用软件的一个重要组成部分,能够方便地绘制和显示电力系统中的各类设备元件,提供统一的图形用户界面。SVG是由W3C组织开发的一种开放标准的文
准确地提取出网页的主题内容并生成文档摘要已经成为一个非常重要而有意义的研究方向。随着万维网的飞速发展,在Internet上形成了不计其数的以HTML网页形式存在的信息源,但是
随着经济和社会的飞速发展,人们认识到环境的污染愈来愈严重,而其中水污染直接威胁到所有生物的生存。水污染已经引起了世界各国的重视。我国政府对水污染也非常重视,并将其
随着网络信息的爆炸式增长,如何帮助用户快速准确地定位所需信息就成了一个十分紧要的问题。通过对搜索引擎查询结果进行在线聚类可以解决这个问题。然而由于查询结果在线聚
电信运营商骨干网管理是整个运营商网络管理的核心。但是目前基于SNMP协议的网络管理系统存在着收敛速度慢、占用目标网络带宽大、拓扑发现精度低、故障定位难等缺点并且缺乏
随着计算机技术和人工智能的发展,许多行业的管理手段和生产方式逐步由人工转变成自动或半自动方式,自动识别系统发挥了重要的作用,尤其在不能直接获取仪表数据的化工、冶金等行
文章的工作内容主要由两部分构成,第一部分主要是前向安全性在代理签名方案中的应用算法研究;第二部分主要是前向安全性在聚集签名方案中的应用算法研究.第一部分改进了一般
竞争的加剧使得企业和组织致力于提高自身的管理水平和生产效率,随着信息技术在各领域中的广泛应用,越来越多的企业或组织开始利用信息技术来达成这一目标。其中工作流技术作