【摘 要】
:
对于轨迹分析来说,轨迹聚类一种重要的数据挖掘技术。大多数聚类算法面临着两个具有挑战性的问题,即选取合适的距离度量方法以及获取最优的聚类个数。凝聚式的信息瓶颈算法通
论文部分内容阅读
对于轨迹分析来说,轨迹聚类一种重要的数据挖掘技术。大多数聚类算法面临着两个具有挑战性的问题,即选取合适的距离度量方法以及获取最优的聚类个数。凝聚式的信息瓶颈算法通过引入特征空间的概念,并且最大化特征空间与最终聚类结果之间的互信息,同时保持原始轨迹数据与最终聚类结果之间的互信息最小化。利用此信息瓶颈,我们避免了轨迹聚类中轨迹间距离的度量问题并且能够得到最优的聚类个数。而且,本文提出了对凝聚式的信息瓶颈算法的改进,即快速凝聚式的信息瓶颈算法。通过两种加速策略对凝聚式的信息瓶颈算法进行加速,第一种策略是基于空间划分的“剪枝”策略,通过这种策略能够减少每次迭代过程中需要进行信息熵损失计算的轨迹对数量。第二种策略是合并多条候选轨迹,这样能减少算法的迭代次数。通过合成轨迹数据、模拟轨迹数据以及真实轨迹数据的实验分析,Fa IB算法的运行时间比a IB算法减少了10倍左右,并且迭代次数也大大减少。尤其对大量轨迹数据进行聚类时,这种加速效果就更加明显。毫无疑问,轨迹聚类的可视化对于理解算法的核心过程极为重要。因此,本文提出了一个针对于快速凝聚式的信息瓶颈算法的过程可视化工具,帮助用户更加直观和生动地理解算法的核心过程。可视化工具提供了良好的用户交互,允许用户对算法过程的各个关键参数进行调整并且能够得到调整后的结果。本文通过对真实轨迹数据集的实验结果来说明可视化工具对于轨迹分析的高效性。
其他文献
食物分配不均可能是造成世界范围内饥饿问题这一顽疾最重要的因素之一。食物供应链分配体系的目标不仅是连接生产商和消费者,更是合理地分配食物。由于食物供应链分配效率低
随着智能化设备与数字化生活的不断发展,追求单小区覆盖大区域的传统同构蜂窝网已经越来越难以承载不断增长的多样化无线数据业务需求。通过层叠部署多样化蜂窝小区以提升网
网络是呈现复杂系统的一种有效方法。学者们将那些包含庞大数量的节点和由这些繁多节点连接起来的边组合在一起的最终形态称为复杂网络。与常规网络相比,大规模复杂系统网络(
受贿罪长久以来都是理论界和实务工作者争论的热点和难点,由于受贿手段、方式的变化性、多样性,加之刑法条文的抽象概括与现实案件之间总是存在无法直观契合的矛盾,理论界对受贿犯罪争议不断,给司法认定工作带来极大的困难和挑战。而迫于反腐败压力,司法实践中往往将国家工作人员收受财物的行为过分犯罪化。本文以谭某受贿案件为切入点,通过对受贿罪权钱交易特征以及有关司法解释规定的分析,对案例中反映出的具体问题予以评析
语种识别作为多语种语音识别技术的前端,在国际交流与合作中扮演着越来越重要的角色。当前语种识别系统使用的特征可分为声学特征和声学单元之间的配位信息两大类。配位信息
移动无线传感器网络(Mobile Wireless Sensor Networks,MWSNs)由许多部署在监测区域的传感器节点构成,是一门综合多个学科的高集成度技术。移动无线传感器网络作为物联网的基础,已经被广泛应用于军事、通信、医院等很多领域,前景光明且应用价值较高,因此成为广大学者研究的一个热点。由于网络内的传感器节点能量有限且不易替换,研究一个高效的节能聚簇算法是降低网络能耗、延长网络生命
《义务教育英语课程标准》(2011)明确提出,通过任务型语言教学途径,英语教学应注重培养学生以交际能力为主的综合语言运用能力。《牛津英语》八年级Task板块以本单元话题为主
认知无线电(Cognitive Radio,CR)是一种动态频谱接入(Dynamic Spectrum Access,DSA)技术,通过感知周围频谱环境能够迅速准确地探测到未被授权用户占用的频段,在不干扰授权用
伴随着Web 2.0和大数据时代的到来,用户面临着日益严重的信息过载问题。为了满足用户更加多元化和更加个性化的需求,基于显式反馈的个性化推荐技术得到了广泛的研究和应用。
在现在的电子商务网站与社交媒体中,个人信息数据以一种势不可挡的姿态大量迸发,同时也使得用户在使用电子商务或社交媒体服务中获取的信息缺少个性化特征。对用户的个性化链