基于轨迹大数据的相似性度量及推荐方法研究

来源 :石家庄铁道大学 | 被引量 : 1次 | 上传用户:outong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全球定位技术、传感器技术、智能移动终端的快速发展,积累了大量的轨迹数据,使得轨迹数据所包含的信息更加丰富。轨迹中除了原有的时空信息以外还包含了许多其他类型的信息,例如,文本、图片、视频、音频等,这些信息均可作为轨迹属性。这类轨迹被称为多属性轨迹。对多属性轨迹进行分析和挖掘具有巨大的应用价值,如交通路线规划、城市规划、商业选址等。本文主要工作包括:首先,总结归纳了轨迹大数据的高维异构、多粒度、不确定、高冗余的特点。归纳总结了轨迹相似性度量的研究现状,依据不同的数据类型,就经典的空间相似性、文本相似性和时间相似性的评价方法分别进行了说明和总结;归纳总结了推荐方法的研究现状,就轨迹推荐中常用的基于协同过滤的推荐方法、基于模型的推荐方法进行了总结和概括。其次,针对大部分轨迹相似性工作仅关注轨迹的时空信息,仅有少数工作考虑到轨迹中其他类型信息的问题,提出了两种轨迹相似性度量方法MMTD(最大-最小距离)和SUMTD(最小轨迹距离之和)。结合真实轨迹数据分析了轨迹时空相似性和文本相似性之间的相关性。利用模拟数据验证了相似性度量方法对轨迹变换的敏感度。基于真实和模拟数据将所提的相似性度量方法应用在聚类中,并将聚类结果进行了可视化。再次,现有的轨迹推荐方法通常考虑一定的代价标准,如最短距离、最小时间、地点流行度等因素,忽略了用户需求或需要用户精确提供位置点或需求信息,增加了用户负担。针对此问题,提出了两种用户行为概率学习方法,一个是基于矩阵分解的用户行为概率学习方法,另一个是基于多因素概率密度函数的用户行为概率学习方法。基于用户行为概率进行轨迹推荐,并利用真实的轨迹数据进行实验,验证了算法的有效性。最后,利用真实的Foursquare数据集进行实验和验证,结果表明所提相似性度量算法能够衡量轨迹的时空-文本相似性,基于用户行为学习的轨迹推荐方法能够提高推荐的准确性。在未来的工作中,可以将所提方法进行改进应用于用户群体识别、好友推荐或旅游路线推荐系统中,提高用户满意度和推荐的准确度。
其他文献
细晶粒低碳钢生产的关键技术在于控轧控冷。前人虽对轧制温度、压下制度、冷却速度等对组织的影响的一般规律做了研究总结,但在生产实际中,需对成本、能耗、板形及轧机负荷能力
近年来,人们的生活水平与消费需求在不断增长,商品市场的不断繁荣与发展,也使得市场竞争日益激烈。外面的商品琳琅满目,然而个人拥有的金钱有限,购买力也变得有限,对个人而言
介绍了服装情感计算的起源和国内外研究现状,对服装图像情感计算的原理、方法和可行性进行了分析与说明,并对其用途与前景进行了展望,表明这是一项在学术方面和应用方面具有研究
晏建怀在历史题材写作方面形成了自己的鲜明特点,其代表作《帝国的脸谱——北宋官场众生相》,秉持相对客观公正的立场,以轻松调侃的笔墨、直白的现代语词,巧妙借用评书技巧,塑造了
高速公路建设项目后评价工作中经济分析极为关键,通过经济分析反馈信息,能够及时找出宏观投资管理内存在的缺陷,对国家与经济发展不符的技术经济政策基尼训狗修正,为指标参数
同符合体字是指由两个或两个以上相同部件构成的字,如“从”字等。从商代甲骨文到现行汉字,这类字一直存在着。本文着重讨论了同符合体字的形音义关系,分析了它们繁简无别,同符异
自导深弹应用尾追导引法攻击目标,工程实现容易,鲁棒性强。根据自导过程弹目相对关系,分析了尾追导引弹道特点,建立了导引弹道数学模型,并进行数学仿真计算,结果验证了尾追式
<正>何为发动机烧机油,从理论上分析,发动机烧机油有2种情况,一种为发动机运行时机油正常消耗,一种为发动机运行时机油异常消耗。发动机运行时机油正常消耗,指的是发动机在运
高校思想政治课是一门系统性、科学性、时代性很强的课程,它在培养大学生朝着健康稳定方向发展上有极其重要的作用。从3个方面阐述了如何发挥高校思想政治课德育导向功能。
文章运用数据包络分析模型中BCC模型与超效率模型,实证测算了2010年我国31个省级政府电子政务效率。结果表明:仅有3个省份是技术有效的;剩余省级地区中6个省为纯技术效率有效