基于时间粒度的时序关联规则挖掘研究

来源 :兰州交通大学 | 被引量 : 4次 | 上传用户:wdtt111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当前环境下的研讨热点之一,他需要对原始数据进行剖析来完成信息数据的分析,除此之外现有的规则和决策内容都会影响到最终的分析结果,其中关联规则是数据挖掘领域里最有研究价值的研究目标。早期关联规则挖掘方式相对静止,并不重视时间因素,它被认为能够忽视时间规则且保持稳定可行。可是在对挖掘结果的整理过程中,我们发现现实生活的规则往往受时间影响,由此得出关联规则需要考虑时间因素。但这一发现从未认识到不同的时间间隔对时间数据存在的影响。针对时间是动态变换的而规则是相对静止的这一状况,时序关联规则这一概念随之产生。时序关联规则挖掘中事务数据集基于年、月、日等时间粒度。即便时间因素已经被囊括进了考虑范畴,但是却没有解决如何划分时间粒度的问题。不同的时间粒度划分对关联规则挖掘的条数、质量和效率会产生极大影响。故而,为提高挖掘质量,研究具有普适意义的时间粒度动态划分方法是必不可少的。针对目前采用时间粒度静态划分方法会使得同一个规则呈现不同的趋势等问题,考虑到时间粒度的划分思想和聚类思想具有类似性,所以本文采用聚类分析这一方法来完成时间粒度的划分,随之提出了融合统计分析和自组织映射神经网络的时间粒度动态划分方法,而后应用于时序关联规则挖掘算法。在此研究基础上,根据武威市呼吸系统疾病病例数据和同期气象数据资料,分析两类数据的相关性,结合本文提出的时间粒度动态划分方法完成时间粒度的自动划分,建立时序关联规则挖掘模型。同时,针对气象数据间的层次关系,将数据分层加入到时态关联规则挖掘算法中,使算法更精确地提取有价值的规则。本文应用时序关联规则算法对实验数据进行了挖掘,发现了呼吸系统疾病与气象因子间隐藏的关联信息,说明融合统计分析和自组织映射神经网络的时间粒度动态划分这一方法能够将规则的变化过程表现地清楚透彻,而且能够及时地掌握规则的详细变化趋向,从而进一步提高时序关联规则挖掘的质量。
其他文献
目的:评价心肌梗死恢复期经皮冠状动脉介入治疗对左心室重构和收缩功能的影响。方法:将成功经皮冠状动脉介入治疗后又有造影复查的380例冠心病患者分为2组,①心肌梗死组224例
鸟形陶鬶,是山东省青州市博物馆众多的鬶形器藏品中,一件造型似鸟、构思独特、制作精美、比较罕见的龙山文化时期的精品,为国家二级文物。 $$    龙山文化,我国新石器时代晚期
报纸
摘要:随着城市轨道交通客流量的增长,既有线路供需趋于饱和,由此带来的行人拥挤以及出行安全问题日趋严重;在“公交优先”的政策背景下,如何优化车站资源配置,创造人性化的乘车
随着畜禽规模化、集约化养殖的发展,国内外饲料中广泛使用种类繁多的饲料添加剂。抗生素饲料添加剂能降低畜禽发病率和死亡率,促进畜禽生长、改善胴体品质,但同时也造成了严重的
卓越绩效模式是一种在国际上广为流行的全面质量管理模式。文章在界定电网企业财务资源评价内涵的基础上,构建了包括财务战略、全面预算管理、成本管理、营运资本管理、存量
采用两种丙烯酸盐类聚合物和无机螯合分散剂复配制得无泡皂洗剂.通过与染料的作用,达到防沾色的目的.另外,还能提高干、湿摩擦牢度,各组分无泡,且成本低廉
目的:通过对土鳖虫酶解液不同DA201-C大孔树脂洗脱部位进行溶栓活性的药效学筛选,筛选其强活性部位。方法:以凝血块体外溶解率;角叉菜胶血栓模型24、48 h黑尾长度及黑尾形成
通过对夏黑葡萄进行不同生育期水分胁迫处理,探讨不同时期水分胁迫对夏黑葡萄的枝条、果粒生长变动情况,叶片的气孔导度、胞间CO2浓度、蒸腾速率、净光合速率、MDA含量的影响
<正>银行提升网点竞争力的意义何在?随着信息技术的迅猛发展,银行网点空心化程度有所加重,建立在物理网点、人员数量上的银行优势,正在被网络电子功能的开发应用所取代。发达
柏拉图的美之问到底问什么,是一个值得弄清的问题。这其中。“美”的词性是非常重要的。“美”作为名词,其本质问题是不可证实的,这也是几千年来美的本质问题一直没有满意的答案