【摘 要】
:
数据流频繁项集挖掘是当今数据挖掘和知识学习领域重要的研究课题之一。数据流高速性、连续性、无界性、实时性对挖掘算法在时间和空间方面提出了更高的要求。传统的数据挖掘算法由于其存储结构需要频繁地维护,其挖掘方式的精度和速度较低,空间、时间效率不高。在基于粒计算和ECLAT算法的基础上提出一种挖掘数据流滑动窗口中top-K频繁项集算法,采用二进制方式存储项,利用位移运算实现增量更新,实施与运算计算项集支持
【机 构】
:
桂林电子科技大学计算机科学与工程学院
论文部分内容阅读
数据流频繁项集挖掘是当今数据挖掘和知识学习领域重要的研究课题之一。数据流高速性、连续性、无界性、实时性对挖掘算法在时间和空间方面提出了更高的要求。传统的数据挖掘算法由于其存储结构需要频繁地维护,其挖掘方式的精度和速度较低,空间、时间效率不高。在基于粒计算和ECLAT算法的基础上提出一种挖掘数据流滑动窗口中top-K频繁项集算法,采用二进制方式存储项,利用位移运算实现增量更新,实施与运算计算项集支持度,同时利用二分查找法插入到项目序表中,输出前K个频繁项。实验结果表明,该算法在K取值不太高时具有较好的
其他文献
目前高校辅导员队伍建设存在辅导员遴选任用非专业化、工作职责不明确、人员不稳定等问题。而且,高校辅导员队伍专业化、职业化建设的现实条件已经成熟。为此,要采取明确辅导员
针对扩招后学生水平差异的显著,根据最近发展区理论,在我校《无机及分析化学》基础课教学中进行分层教学法的实践,按能力对学生进行分组,同时设计多层次的教学目标,有针对有区别地
提出了一种大规模通信网络流量异常特征分析的多时间序列数据挖掘方法,把多个网络流量特征参数构成的时间序列作为一个整体进行分析研究,进行多时间序列数据挖掘产生网络流量异常相关的有效关联规则,对整个通信网络的安全威胁进行描述。Abilene网络数据验证了该方法。
为了能快速近似求解多旅行商问题,提出了双层降解混合算法。首层降解根据问题空间展布特性,利用聚类技术将问题分解为若干子类问题,底层降解将子类问题转换为经典的旅行商问题,通过缩减子类问题初始状态下的边数量,使得子类问题求解难度得到再度降低,最终利用精确算法进行求解能够得到高质量优化解。对比实验表明双层降解混合算法具有计算时间短和求解质量高的优势,说明了新算法的有效性和高效性。
隐私保护挖掘是近年来数据挖掘领域的热点之一,主要研究在避免敏感数据泄露的同时在数据中挖掘出潜在的知识。实际应用中,大量的数据分别存放在多个站点,因此分布式隐私保护数据挖掘(distributed priva-cy preserving data mining,DPPDM)的研究更具有实际意义。对该领域的研究进行了详细的阐述,比较了各种方法的优缺点,对现有方法进行了分类和总结,最后指出了该领域未来的
采用相关反馈技术提高检索效率已成为工程图纸检索方面的重要研究内容之一。现有的相关检索模型需要人工的多次参与,针对这个不足,提出一个基于反馈日志的检索模型:首先对工程图纸检索中的反馈日志进行分析,找出工程图纸之间的潜在关联关系,建立关联规则库;然后将传统的基于关键字的检索和基于内容匹配的检索两种方法结合起来;最后结合相关算法建立检索模型。实验表明,该检索模型可以减少人工参与检索的次数,并保证有较高的
针对人脸识别中的光照、表情和遮挡变化三大难题,引进热红外人脸克服光照变化,并采用融合局部形变模型的人脸分类方法克服表情和遮挡变化。该方法将热红外测试人脸看成人脸库的线性组合,并用形变模型表示,通过l1最小优化求解组合系数,根据系数的稀疏性进行人脸识别。为了进一步提高算法的鲁棒性,采用人脸分片加权的策略。在Equinox人脸库上通过大量实验表明:基于红外光的人脸识别性能明显高于可见光对光照变化的影响
为了从不同类型的视频中有效地提取关键帧,提出基于群体智能与K-均值相结合的关键帧提取方法。该方法首先提取视频的颜色特征向量,利用基于群体智能的聚类方法自组织地对颜色向量进行聚类,得到初始聚类;然后通过K-均值对初始聚类进行优化并加快算法收敛,得到最终聚类;最后,提取每类中距离聚类中心最近的向量对应帧并将其作为关键帧。实验表明,该算法能有效地提取出代表视频内容的关键帧,对镜头的相似性和连续性反映准确
为了在光线环网中高效地传输数据,首先确定了所研究光纤环网的物理拓扑结构是一种多信道单向环网;然后详细地阐述了在其中建立数据传输模型的步骤和方法,以及各个模块的流程图;最后在设计的实验平台上对模型进行了完整的测试。测试结果表明,数据传输模型可以在光纤环网中高效且正确地运行。
专业实习是法学教育的重要组成部分。由于时间安排不合理及实习基地建设失范等原因,当前的专业实习已呈现形式化的倾向。我们应科学设置实践性课程体系,加强实习基地建设,不