序列事件周期性检测模型优化及应用

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:shizhijian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
周期模式挖掘是在时间序列数据中寻找重复出现的序列模式的方法,主要用来刻画变化较小或者稳定的用户行为模式,在许多应用场景下,时间序列数据的周期模式挖掘都具有重要意义。本文在基于交叉熵的序列事件周期性检测方法CEPD(Cross-Entropy based Periodicity Detection)的基础上,针对该方法存在的三个问题,做了进一步改进和拓展研究,并结合电子商务和移动互联网环境下的用户行为进行了推荐应用。本文的主要内容包括三个方面,第一,实现了基于交叉熵的序列事件周期性检测方法的对比研究,并给出了该方法理论上的时间复杂度,在构造数据集和实际数据集上,将基于交叉熵的序列事件周期性检测方法与其他已有方法在运行效率、抗噪音性能和周期检测结果的准确率这三个方面进行了对比,从实验和理论两个方面证明了该方法的可用性。第二,使用机器学习中的正则化技术对周期检测方法的目标函数进行优化,解决了交叉熵随划分周期的增大而系统性下降的问题,提高了方法的可用性以及周期检测结果的可用性,并使用构造数据和实际数据进行实验验证。在具有明显周期的数据集上,添加了正则化项之后的模型更容易检测到合适的周期值。第三,挖掘用户行为模式的周期性,结合周期性检测的结果进行推荐应用。加入周期性信息一方面引入了用户行为的时间信息,另一方面刻画了用户自身的规律性特征。CEPD算法效率分析从理论和实验两个方面验证了基于交叉熵的序列事件周期性检测方法的可用性,正则化技术的引入解决了交叉熵随划分周期的增大而系统性下降的问题,提高了方法的可用性,为下一步的推荐应用奠定了基础。本文的贡献在于以下三个方面,第一从理论上证明了该算法的时间复杂度优于其他算法,从实验和理论两个方面证明了该方法的可用性。第二引入机器学习中的正则化技术,对基于交叉熵的序列事件周期性方法进行优化处理,解决了交叉熵随划分周期的增大而系统性下降的问题,提高了该方法的可用性以及周期检测结果的可用性。第三结合基于交叉熵的序列事件周期性检测结果,构建了基于用户行为周期性的推荐策略,同时考虑了用户意图和推荐时间,一定程度上提升了推荐的效果。
其他文献
在城市环境逐步得到改善的情况下,农村及农民已经成为环境污染的最大受害者,城乡环境公平问题日益凸显。探讨城乡环境不公导致农民生态权益缺失问题,从社会经济根源、社会意
姜夔所作的《白石道人歌曲》六卷,是现存最早的宋词歌谱。本文从姜夔词调歌曲的风格和词意入手,从韵律(平仄)、行腔等方面对它的演唱进行研究和探索,旨在表现姜夔词调歌曲的
为了响应国家中部崛起战略,分析武汉港口物流与核心腹地经济发展之间的关系.根据2000~2010年武汉市港口物流与经济发展的数据,利用协整理论及其计量学分析软件eviews6.0,对武
法国电网运行管理水平居于世界领先行列,研究法国电网的运行管理现状,对提高中国电网运行管理水平具有很好的借鉴意义。在介绍法国电力基本概况、法国电网调度体系、调度运行
开展对公务员制度的比较研究,对我国公务员制度的建立与完善具有重大的理论和现实意义。为了有效地进行公务员职务管理,必须首先建立和完善公务员管理机制。健全的公务员管理
随着利率市场化改革的不断推进,金融脱媒趋势的持续深化,普惠金融的政策陆续落地,“互联网+金融”的理念也稳步创新,加之P2P行业的迅速发展,传统商业银行面对的竞争压力是史
产业环境是产业成长与发展的土壤和雨水。2016年作为“十三五”开局之年,上海集成电路产业发展的政策措施密集实施,上海集成电路产业投资基金顺利完成首期285亿元募资,一批与
这篇论文旨在研究阿曼应该怎样多样化发展,来摆脱其对于作为国内和国外主要收入来源的石油部门的依赖。这篇论文用世界银行提供的1990年至2014年的进口、出口、国民生产总值
今天的重庆大学建筑城规学院可追溯至原重庆大学1937年成立的建筑组。1952年原重庆大学等西南6所高校的相关专业合并组建为重庆土木建筑学院并迁入现址,历经重庆建筑工程学院
在新课程改革的不断推进中,高中文言文的教学地位与日俱增。然而,高中生普遍缺乏对文言文的学习兴趣,尤其是篇幅长,理解难的文言散文。面对这样的教学现状,笔者认为有必要从高中生文言文学习兴趣的培养上下功夫。思维导图作为一种新型思维工具,其趣味性和逻辑性能辅助高中文言散文的教学,提高高中生的文言散文阅读能力。目前,国内外将思维导图运用到高中文言文阅读教学中的研究相对较少,且现存的研究并没有将文言文中的诗歌