论文部分内容阅读
如果某一特定事件周期性地重复出现在序列中,则认为该特定事件在这个连续的序列事件中具有周期性。从历史序列数据中观察并发现事件的周期性能够揭示事件的未来趋势,从而为管理活动提供更具有价值的信息,帮助决策者实施更有效的决策。相关领域的以往研究成果一般都需要知道事件发生的模式来寻找周期,或者用户指定周期来进行事件发生的周期性检验。为了实现在没有任何预知信息的情况下有效发现某一特殊事件在时间序列数据中的周期性,本文提出了一种基于交叉熵检测给定事件在序列数据中周期性的方法。整个论文内容由六个章节构成。首先介绍了研究的背景,具体的分析了现有的数据挖掘及其分支研究时间序列挖掘的方法和商业应用。第二章是对相关研究的一个综述,综合分析了各类周期检测算法和他们各自应用领域上的优缺点,从而得出,我们需要一种不预先设定周期且算法简单并能应用于商业的序列事件周期检测算法。第三章是整个周期检测算法的一个总体概述,解释了与研究相关的一些概念和算法中每一个方法的功能。第四章是对周期检测算法的一个详细分解和演绎,并且采用了两组真实数据来验证了算法的可行性。第五章是算法的应用,在电商平台下,该算法可以检测出消费者历史购买清单中各类目商品的购买周期,并且能将这个周期结合推荐系统的基础功能使得推荐结果更精确。最后是对全文的总结以及对未来研究的展望。论文的主要贡献在于提出了一种检测序列数据中特定事件周期性的工程化算法。其中,该算法首先将给定事件在时间序列中的周期性区分为分布周期性和结构周期性;其次,提供了一种能够对序列数据实现连续划分的方法;然后根据不同划分结果的周期性强弱的指标——划分熵,来区别不同划分结果对于揭示事件周期性的优劣程度。通过算法在电商平台下对用户购买数据的分析,证明该算法可以检测到用户对一些类目商品的购买行为具有周期性,据此,在以后的推荐系统中,我们就能在推荐策略上引入时间因素,让推荐结果更精确可靠。