基于统计语言模型的交通会话识别

来源 :山东大学 | 被引量 : 0次 | 上传用户：dflhe88

【摘要】

：

会话是指一个用户或应用为了完成某个特定任务而提交的查询或请求的序列。会话识别因其能够提供对用户行为模式的深入理解而备受关注。许多研究人员就Web领域和数据库中的会

【作者】

：

娄新燕

【出处】

：

山东大学

【发表日期】

：

2014年期

【关键词】

：

会话识别超时方法统计语言模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

会话是指一个用户或应用为了完成某个特定任务而提交的查询或请求的序列。会话识别因其能够提供对用户行为模式的深入理解而备受关注。许多研究人员就Web领域和数据库中的会话识别问题做了不懈的探索。其中,使用最广泛的超时方法和基于统计语言模型的方法在特定应用下都取得了良好的表现。交通数据会话是指用户为了完成某个任务而经过的交通路口序列。交通会话识别对于路径预测、拥塞检测、基于位置的服务等应用具有重要的意义。但是,关于交通数据中的会话识别工作非常有限。本文首次提出交通数据中的会话识别问题。首先,我们选用超时方法和基于统计语言模型的方法来进行会话识别。超时方法主要考察相邻交通路口之间的时间间隔对会话识别的影响。该方法认为当两个相邻的交通路口之间的时间间隔大于某个预定的时间阈值时,这两个路口不属于同一个会话；否则,它们属于同一个会话,也就是说这两个交通路口是为了完成同一个任务而被连续经过的。基于统计语言模型的方法不依赖任何时间信息,而是通过衡量交通路口序列的信息改变来进行会话识别。给定一个交通路口序列,通过计算其在数据集中出现的概率来估计该序列的频繁程度,并用信息熵衡量该模型的质量。当一个新的交通路口加入到当前序列中并使得两个序列的熵值的改变量超过一定阈值时,就认为该路口是一个新的会话的开始。无论是超时方法还是统计语言模型,在进行会话识别时,都只考虑了一种影响因素。也就是说,超时方法仅仅把时间因素作为会话识别的依据,而统计语言模型主要考虑交通路口序列的全局规律性。时间信息对人们的行为有着很大的影响,人们的行车路线通常能够展现出很大程度的时间规律性。直觉上来说,相邻两个交通路口之间的时间间隔越大,它们属于同一个会话的可能性就越小。因此,我们提出了一个时间衰减函数来衡量相邻路口之间时间间隔对会话识别的影响。另外,人们在实际生活中,往往习惯选择自己熟悉的路径。因此,对于一个用户来说,经过的交通路口序列会呈现出一定的规律性。基于时间因素和路口序列规律性对会话识别的共同影响,我们提出了一种改进的统计语言模型,该模型在传统语言模型的基础上融合了时间因素。假设存在一个属于同一会话的路口序列,相邻路口之间都不存在较长时间的停留,而且这个序列频繁地按照特定顺序被经过,那么这个序列的熵值改变量及时间影响函数值都会很小。然而,当某辆车经过一个新的与当前会话不相关的路口时,该路口的引入将会引起该序列熵值的增大。另外,如果该车辆在此路口与先前序列之间有较长时间间隔的话,也会使得新序列的时间影响函数变大。不论是熵值的增大还是时间函数值的增大都可以作为会话边界识别的标识。最后,我们在真实的交通数据集上进行了大量的实验来验证我们提出的基于改进统计语言模型方法的有效性。实验结果表明我们的方法优于只考虑一种影响因素的超时方法和传统的基于统计语言模型的方法。另外,通过比较分析三种方法性能上的差异得知时间因素比全局规律性在会话识别中的影响更大。

其他文献

卓越工程师团队化培养模式研究——以软件项目为例

传统模式的卓越工程师培养重视学生实践与动手能力的培养,也对学生的团队合作能力提出了要求,但是一般情况下学生团队的运作水平与业界仍然存在差距。本课题提出了一种新型卓

期刊

卓越工程师团队化培养模式

谈英语教学中交际能力的培养

从英语教学的角度来谈素质，可以理解为人们学习和掌握英语的一种潜能，即是人们的英语能力的形成及发挥的内在渊源。“英语课程标准”指出：“激发和培养学生学习英语的兴趣，使学生

期刊

初中英语教学英语交际能力能力的培养综合语言运用能力英语课程标准学习英语英语能力终身学习

华裔设计师王薇薇：从冰上舞者到婚纱女王

她曾痴迷于花样滑冰，连夺几次全美青少年花样滑冰冠军，18岁那年仅差一步便能撞开美国花滑国家队的大门。这个失误却成就了她另外一番精彩的人生。从小就拥有敏锐时尚触觉的她因

期刊

婚纱女王王薇设计师舞者华裔花样滑冰青少年

供电企业电费管理措施研究

电费管理可以说是电力部门日常运营中的核心工作，也是现金流管理中最重要的，文章分析了如何加强电费管理工作，使电费核算管理工作更为规范化．制度化。

期刊

供电企业电费管理措施

小儿脑性瘫痪的早期诊断

小儿脑性瘫痪的早期诊断北京医科大学第一医院（１０００３４）林庆脑性瘫痪（简称脑瘫，ｃｅｒｅｂｒａｌｐａｌｓｙ，ＣＰ）是出生前到生后１个月内由各种原因所致的非进行性脑损伤。主要表现为中枢性运动障碍及姿势异常，症状在婴儿期

期刊

小儿脑性瘫痪北京医科大学第一医院肌张力低下新生儿期早期诊断非进行性脑损伤早期矫治手足徐动中枢性运动障碍

空心菜无公害高产栽培技术探讨

空心菜的营养丰富,而且具有消食解毒、利尿凉血等功效,是很多消费者喜爱的蔬菜品种。随着近年来人们生活水平的提高和环保意识的加强,对于无公害空心菜的需求量在不断增加,因

期刊

空心菜无公害高产栽培技术

肺结核病患者痰液性状与抗酸杆菌阳性检出的分析

目的分析肺结核病病患痰液性状与抗酸杆菌阳性检出。方法选取本院于2017年1月-2019年7月期间收治的肺结核病患1200例痰液样品作为研究对象,观察查验结果。结果1200份痰样品中

期刊

肺结核病痰液性状抗酸杆菌阳性检出

两种不同采血方式对血常规的影响研究

目的研究两种不同采血方式对血常规的影响。方法在我院2018年12月-2019年2月收治的血常规检测患者中选取16例作为研究对象,所有患者均进行末梢采血与肘静脉采血,末梢采血检验

期刊

两种不同采血方式血常规

独立董事制度建立的背景、条件及对策

本文对我国上市公司建立独立董事制度的背景、内外部条件进行分析,认为当前建立独立董事制度的条件尚未成熟,并在此基础上提出几点建议.

期刊

治理结构股权结构独立董事制度goveming structureequity structureindependent director institut

以特色校本课程开发促进学校特色发展

本文结合南宁市菠萝岭小学开发校本课程的经验,从促进学校特色发展的角度系统阐述了校本课程开发的内涵、原则、程序和评价方法。

期刊

校本课程学校特色

基于统计语言模型的交通会话识别

与本文相关的学术论文