路网环境下的最长频繁路段序列挖掘算法

来源 :第31届中国数据库学术会议 | 被引量 : 0次 | 上传用户:reno1126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以GPS为代表的定位技术的广泛应用使得人们可以得到大量移动对象的轨迹数据,并从中挖掘出有价值的信息.对路网环境下轨迹模式挖掘问题进行研究,提出了适用于路网环境的轨迹模式:频繁路段序列.这是首个针对路网环境提出的轨迹模式,能够反映路网中对象的群体性运动.对于这一轨迹模式,提出了相应的挖掘算法,并利用地图匹配得到的匹配路段信息对算法进行优化.另外,和已有工作中只关注轨迹模式的数量不同,首次提出使用量化指标来衡量挖掘得到的轨迹模式的有效性.最后,使用真实轨迹数据进行了实验.通过大量充分的实验,证明了提出的轨迹模式在路网环境下各项有效性指标均比已有工作更优,挖掘得到的轨迹模式序列质量更高,同时挖掘算法具有很好的性能.
其他文献
社团结构被认为是真实世界网络中的重要特性之一.社团检测有助于理解真实的网络世界,并且能够更好地分析各种复杂系统.关于社团检测的研究已经提出了多种算法.目前,大部分社团检测算法仅使用节点间的链接来判定网络中存在的密集区域,但是很大程度上忽略了节点自身的特性.提出了一种新颖的社团检测算法ATSP,该算法通过度量节点间结构和属性的相似度并且利用属性传递的思想进行社团检测.真实数据集上的广泛实验表明,AT
网络用户可信性是网络不实信息判别的重要依据,自Web2.0出现以来引起社会广泛关注.提出了基于MYCIN推理的新颖信任关系判别方法,该方法综合利用了现有的信任关系以及用户之间的评分关系,以用户对另一用户的评分记录为证据,基于监督学习得到的规则集,通过证据合取产生对"信任"和"不信任"的量化表示,推测出用户之间的信任关系.在扩展Epinions数据集对比实验的结果表明,该方法取得较高的准确率和召回率
大数据已深入到各行各业,医疗作为人民群众基本需求更是首当其冲.医疗数据的庞大规模和复杂性为研究新的医疗数据挖掘技术带来机遇和挑战.通过整合MVC框架、MapReduce框架及NoSQL等技术,研究面向医疗领域的大数据存储、处理、高效并发数据挖掘算法及分析模型等关键技术,研制医疗大数据挖掘平台以提升医疗数据的综合利用,提高医疗服务水平,从而扩大医疗信息化建设成果的经济和社会效益.
互联网广告收入是互联网企业及周边产业收入来源的一个重要组成部分,而广告点击率则是影响互联网广告收益的最重要指标.为了提升广告点击率,对用户实施精准广告推送是行之有效的方法,也是减少成本、提高利润的一个重要手段.介绍了基于用户浏览行为的广告推送系统——APS.APS通过记录用户浏览过网页的相关内容,分析用户访问网页的主题,建立用户相似性模型,对用户兴趣喜好进行个性化预测,从而实现对用户的精准广告推送
微博是网络舆情产生和传播的主要途径,分析微博用户对热门话题和突发事件的观点是舆情监测的任务之一.设计并实现了一个面向微博话题的舆情数据分析平台(public sentiment platform based on microblog topics analysis,PUMA),从新浪微博、腾讯微博等微博平台上爬取热门话题的相关数据,对一定时间段内的舆情数据进行情感分析和话题相关度分析等,掌握公众对
TPC-C规范作为测试数据库性能的行业标准,已被广泛使用在测试联机事务处理(OLTP)性能,但目前仍缺乏开源的可视化工具作为支持.根据TPC-C规范,介绍了一个开源VisualDBBench工具的设计与实现,并且使用VisualDBBench工具进行测试,验证了针对内存数据库在OLTP相对传统数据库具有较优的性能优势.
面向大数据时代下大规模移动对象数据管理的挑战,设计实现了一个移动对象检索服务原型系统.系统基于Linux高性能集群,利用高斯滤波对移动对象轨迹数据进行漂移点数据过滤预处理;设计了一种可扩展时空数据模型存储移动对象轨迹数据;提出了一种数据聚合方法,将大规模移动对象轨迹数据聚合为多分辨率时空立方体,通过传输适当分辨率的时空立方体,大大降低了网络传输数据量;基于HTML5技术,在Web浏览器中高效动态展
针对微博文本篇幅所限、信息密度过低等特点,提出了基于加权序列的微博文本特征表示模型,在TextRank算法的基础上,重新设计了节点选取策略,充分利用了所有可能的微博信息;并提出了2种加权算法,对原始的排序结果进行加权处理,使得权重更具梯度.实验结果表明,相较于其他基于统计的特征表示模型,提出的基于加权序列的特征表示模型,在朴素贝叶斯分类中具有更高的准确率.
车联网应用的最终目标是将由通信设备和嵌入式计算机构成的信息空间与人们的车辆物理空间融为一体,支持用户随时随地并透明地获得符合其个性化需求的信息服务.而车载传感信息具有传感器种类构成多样化、车联网网络规模扩大化、信息规模大数据化等特点.要对这些信息进行有效地利用,就必须充分考虑信息中的空时特性和信息本身的质量.因此,基于上下文感知模型和车联网环境下的上下文种类划分,充分研究基于空时索引的上下文存储方
随着信息化的进展,以智慧城市为代表的新兴应用场景促进了新型协同计算模式的产生.其特征是计算向数据端靠拢,终端节点数目急剧增加且具有局部智能、物理环境及自身资源状态复杂多样等特性,传统的配置管理方式已无法满足新的需求.为应对新技术带来的挑战,提出一种基于情景感知的分布式配置管理机制,通过对终端节点的情景信息进行感知并构建资源向量模型,为终端节点的配置管理策略进行定制化处理.此外展示了实现该机制的原型