【摘 要】
:
随着时间的推移,数据呈爆炸式的增长,要想从这些复杂、海量的数据中发现潜在有用的信息,是一件极为困难的任务,同时也给时间序列数据挖掘带来了巨大的挑战。数据集中的某些数据,它
论文部分内容阅读
随着时间的推移,数据呈爆炸式的增长,要想从这些复杂、海量的数据中发现潜在有用的信息,是一件极为困难的任务,同时也给时间序列数据挖掘带来了巨大的挑战。数据集中的某些数据,它们与大多数数据的一般行为或模型不一致,这些数据被称作异常数据。绝大多数的数据挖掘算法通常把异常数据视为噪声而丢弃,然而在一些实际应用中,异常数据更具有研究价值。因此,对时间序列的异常进行深入地研究具有重要的意义。
首先,研究了时间序列的滑动窗口方法、自顶向下方法和由底向上方法,给出了基于重要点的时间序列分段算法,通过重要点将时间序列分成多个互不重叠的子序列,并提取每个子序列的特征值,为聚类算法进行异常子序列的检测做了准备。该算法在有效地压缩了时间序列数据的同时保留了原有时间序列的主要特征,并且具有较低的时间复杂度。
其次,研究了围绕中心点的划分算法PAM聚类算法、基于PDS、TIE和PMI的快速PAM聚类算法和基于k中心点的迭代局部搜索聚类算法,通过对初始簇的对象个数的限定和初始簇的平均距离的求解来确定初始的中心点,从而给出了一种基于初始聚类中心点选取的改进的PAM(IPAM)聚类算法,然后通过对划分后簇的平均距离进行阈值的设定来检测异常子序列,并着重对该算法的异常检测质量和时间效率进行分析,实验证明该算法具有与局部异常检测算法类似的检测效果,较低的时间复杂度,并且具有优于PAM算法的检测效果和时间复杂度。
最后,将改进的PAM(IPAM)算法运用到程序设计自主教学与学习平台中,挖掘学生的成长效果。挖掘的结果有助于掌握学生的学习情况,从而能够更好的开展教学活动。
其他文献
想要促进军事装备建设快速发展,就需要以国防科技创新为出发点,同时实现科技创新则应以“优化制度供给”为基础.文章主要针对军事装备技术创新政策的完善进行分析,结合军事装
利用网络平台进行学习已成为高校大学生必要的学习方式之一,其对大学生学习能力的提升以及今后的成长成材具有重要作用.本文分析了大学生网络学习现状以及存在的问题,并进一
21世纪以来,我国经济得到较快发展,其中民用航空事业发展较为迅速,能够有效推动我国社会健康发展,对我国经济提升具有较大促进作用.但是,由于我国民航航空事业发展起步相对较
本文以河北唐山钢铁公司“退城搬迁”为例,研究该类企业整体搬迁的必要性和重要性以及原址土地盘活再利用方案.认为此类污染企业“退城搬迁”符合国家及当地产业发展政策和城
日照时数是是地面气象台站观测的基本项目.目前,我国气象部门在日照时数观测业务中使用的是暗筒式和聚焦式日照计,需人工制作、安装和更换日照纸,人工判断感光迹线,自动化程
在健康监测智能穿戴系统(SWS)的研究和开发方面,学术界和产业界都做出了广泛的努力,SWS的持续发展受到了医疗成本飙升的影响,通过微纳米技术、传感器微型化和智能织物技术的
利用常规观测资料以及NCEP/NCAR1°×1°再分析资料,对2016年2月12日发生在温州机场的一次大雾天气过程进行了总结分析,结果表明:温州沿海夜间的水汽辐合强盛、逆温层的存在
智能家居是IT技术、网络技术,控制技术向传统家电产业渗透发展的必然结果,相对于普通家居,智能家居将被动精致结构转变为具有智能的工具,提供全方位的信息交换功能,智能家居强调人
本文探讨了高等级生物安全实验室在生物安全风险评估活动中存在的问题.结合故障树分析、模糊综合评价法建立了实验室生物安全风险评估模型,实现了生物安全风险的定性及定量评
现阶段随着抽油烟机清洗技术的不断发展,清洗技术从物理性拆洗、结构自身免拆洗、静电拆洗过渡到气体喷洗和蒸汽清洁等多种方式.但是现阶段多采用蒸汽清洁的方式,多功能蒸汽