不确定时间序列聚类算法的研究与分析

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:anlanyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列作为大数据的一种特殊形式,广泛存在于经济、医疗、语音识别等领域,是人们日常生活中随处可见的一种数据存在形式。随着数据不确定性的普遍存在,研究学者开始关注不确定性对数据潜在信息的影响。本文针对连续型不确定时间序列进行聚类分析与研究,改进传统静态数据聚类算法,寻求更加适合不确定时间序列特性的聚类算法。首先,本文针对不确定时间序列的表示方法,比较了时间序列的动态特性与静态数据之间的差异,并总结了以概率密度表示的连续型不确定时间序列和以概率值表示的离散型不确定时间序列的两种不同表示方法;之后,基于传统静态数据聚类算法的研究,分析了针对时间序列不同相似度计算方法,以及初始簇心选择方法对聚类结果的影响;并基于最小生成树思想,对现有的最大最小值初始簇心选择方法进行改进,使选择出的簇心分布更加均匀。然后,本文改进传统不确定数据聚类算法UK-Means算法,采用概率误差函数来表示时间序列在每个时间点上的观测值与真实值之间的差异。针对不确定时间序列数据集中存在的时间位移误差,采用限制窗口宽度的动态时间规整ULDTW算法来深度挖掘不确定时间序列间复杂的相似性关系,并改进传统均值求簇心的方法,提出了1ToNCenter算法来提高聚类质量。试验表明,在处理不确定时间序列时,与传统UK-Means算法相比,本文提出的基于ULDTW算法的UKMeansULDTW算法的聚类结果的ARI指标有大幅度提高。最后,针对UKMeansULDTW算法中ULDTW算法复杂度较大的问题,本文结合UK-Means算法和凝聚式层次聚类算法对不确定时间序列进行聚类。采用微簇的概念,利用基于欧式期望距离的UK-Means算法将不确定时间序列集划分成分布较为紧密的微簇,然后再使用基于ULDTW算法的层次聚类算法逐步合并微簇,从而减少DTW的计算量。同时,该方法降低了聚类算法对初始簇心的依赖性,使聚类结果更加稳定。
其他文献
根据实验室粘土岩非饱和渗流实验的结果,将考虑塑性应变硬化、Hoek-Brown和Mohr-Coulomb 3种非饱和渗流应力耦合模型应用于模拟某粘土岩竖井,研究了粘土岩在开挖、通风、衬砌
在进行三轴试验时,应力环测力计读数时间的控制对整个试验结果至关重要.为简化土工试验中三轴试验的读数规定,有效控制读数时间,方便处理试验数据,对原状黄土不固结不排水试
目的:建立电磁裂解水提中药大黄中蒽醌类成分、黄芩中黄芩苷、柴胡中柴胡皂苷a、d的最佳工艺,并利用扫描电镜法初步探讨电磁裂解提取中药的机制,以黄芩为例建立电磁裂解法的HPLC指纹图谱,并与其他提取方法进行比较,以期为该提取技术的推广与应用提供参考。方法:以水为提取溶剂,在提取次数、提取时间、物料粒度、液固比单因素试验基础上,选取3个因素进行Box-Behnken中心组合设计,分别以大黄总蒽醌、黄芩苷
【正】 云南起义爆发时,黎元洪是被袁世凯软禁在北京城中的政治俘虏。护国运动的早期酝酿以孙中山为领袖的中华革命党为主,云南起义反袁,又主要是中华革命党成员的中下级军官
对工程桩质量检测的几种方法进行分析探讨,重点阐述了每一种检测方法中存在的若干需要注意或有待解决的问题,为工程桩质量检测提供了参考意见.
<正>瓦当是中国古代建筑屋檐前端用于遮挡的盖头瓦,也称筒瓦头,是集实用与装饰于一体的建筑构件。最早的瓦当发现于陕西扶风县召陈村西周中晚期宫殿建筑群遗址。早期的瓦当多
目的 评价术后静脉自控镇痛(PCIA)用于老年胸腔内肿瘤病人术后镇痛的安全性。方法 40例ASAI~Ⅱ级胸腔肿瘤术后病人分为对照组(42.6&#177;6.9岁)及老年组(67.8&#177;4.7岁)作术后静脉
【正】 湖北省经济学团体联合会于1984年12月举办了经济体制改革理论座谈会,学习《中共中央关于经济体制改革的决定》。学习中主要讨论了《决定》中的第三、四、五部分。与会
在以前工作的基础上,对同时考虑块体沿对角线变形和沿支座处的水平变形两个因素引起的稳定性问题进行了初步的数值求解,讨论了解曲线即平衡路径的稳定性及系统的静态分叉特征;分
【正】 中国的通俗小说源于说话,有具体的市民听众,需要有环环相生的情节吸引对象,因此重视情节的审美因素。大量的情节现象为中国的小说美学理论家提供了材料,金圣叹、毛宗