多属性值的时空聚类及关联算法研究与应用

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:wwxx10086
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时空数据挖掘是较为前沿、新兴的数据挖掘研究领域之一,旨在分析较高维度的时空数据,提取出时空数据中潜在的、有价值的知识。时空聚类、时空关联则是其重要的两个分支。时空聚类中阈值的合理设定,且将时空聚类和关联规则应用到具有多属性维度的时空数据集中是现在的一大难点。针对这些问题,本文主要从以下几个部分进行研究:首先,针对传统时空聚类算法ST-DBSCAN在人为设定阈值上存在较大随机性,从而导致聚类结果不理想的问题,提出了一种时空距离频数柱状图设定阈值的方法,并通过对比实验来证明该方法下的聚类结果更为合理、准确。其次,针对时空聚类算法ST-DBSCAN仅限于处理三维时空数据的聚类分析,面对多于三维时空数据的聚类,提出了一种新的混合属性时空聚类算法。该算法通过引入Gower相似系数、Dice相似系数与欧几里得距离构建混合属性相似度模型来计算多个事务对象之间属性特征的相似度大小,当满足相似度阈值的多个事务对象则可纳入同一个时空簇内,从而将原始的时空聚类算法扩展到更多维度的聚类分析中。最后,针对在关联规则算法FP-Growth的基础上,如何判断多维时空数据集的时空与属性之间的关联关系的问题,在传统关联规则概念的基础上进行了空间、时间和属性语义上的扩充,同时考虑空间和时间约束,提出一种改进的多属性时空关联算法,从而计算出多维时空数据集的时空与属性之间的关联规则。通过下载职位招聘数据构建多维时空数据样本库,完成模型搭建并实现算法对样本库的挖掘。结果表明,两种算法对多属性时空数据的聚类和关联分析具有良好效果,且拥有较好的普适性,将其应用于不同类型数据的领域,其结果分析能提供合理、有效且实际的指导意义。
其他文献
快中子共振吸收检测爆炸物是一种利用爆炸物中所含的低Z元素对快中子的共振吸收计算爆炸物中核素比例以达到鉴别爆炸物与非爆炸物目的的方法。目前的工作大多基于加速器单能
改革开放以来,我国经济取得了突飞猛进的发展,但是作为经济发展的代价,环境问题也愈发严峻。为了对环境问题进行定量研究,将其纳入经济学研究的框架,学者们引入了影子价格这
日本血吸虫是一种重要的人畜共感染寄生虫,水牛作为其重要的储存宿主,在疾病传播上具有重要意义。水牛感染血吸虫后具有自愈能力。本课题组通过人工感染试验证实水牛具有极强的抗再感染能力。为了探索再感染水牛影响虫体生长发育的分子机制,本研究从形态学的角度比较了来源于初次感染和再感染水牛的虫体表型差异,检测了水牛外周血淋巴细胞细胞因子表达状况,应用RNA-Seq转录组测序技术和基于TMT的蛋白质组学技术分析了
目的:探究miR-181d对喉癌Hep2细胞生物学行为的影响;验证miR-181d是否参加下调喉癌抑癌基因LCRG1的表达。方法:1、运用软件预测的miR-181d和LCRG1基因3′UTR的潜在结合位点,
目前,借助在线教育环境进行学习活动已经进入人们的日常生活当中,但缺少现实环境中教师的主导作用,学习活动的正确性和效率无法得到保证。为此,本文提出一种面向学习路径的知
目的:总结呼吸道烧伤患者气管切开后的临床护理经验,规范护理操作技术程序。方法:对2009年2月1日~2011年2月28日收治的40例呼吸道烧伤患者气管切开后临床护理进行回顾性总结。
随着内燃机技术的发展,在汽车、工程机械、船舶、航空等领域,越来越多的内燃机控制实现了电控化。发动机电子控制器的功能日趋复杂,其检测和排故需要专业可靠的工具和方法。在车辆路试和维修售后场景中,常见的柜式测试系统无法使用,造成了在实际应用中发动机电子控制器自身故障难以排查,带来系统故障的误判、漏判,给系统使用带来不便甚至风险。针对上述问题,论文以发动机控制单元测试系统的小型化、便携化为主要研究对象,在
大气污染呈现出多污染源叠加、多污染物等的复合型污染特征,对生态系统、人类健康和气候变迁等产生极其重要的影响。大气颗粒物是大气环境中化学组成最复杂、危害最大的污染
碳酸盐岩中蕴含大约一半的世界石油储量,而湖相生物碳酸盐岩作为其重要的组成部分,广泛发育于世界各陆相含油气盆地。湖相碳酸盐岩是受古气候、古地貌和古水文等环境因素影响
本文第一部分是探讨市场经济下科技工作者和经营管理者收入的来源问题。文中论述了马克思关于科技劳动和管理劳动在物质生产部门中对价值的创造 ,并在以下两个方面扩展了马克