基于值函数的强化学习在直复营销中的研究

被引量 : 3次 | 上传用户:lilunallen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
直复营销即一种可以得到客户直接回应的营销模式。作为企业的一项长期性经营活动,直复营销贯穿于企业发展的整个过程,因此,通常将长期收益作为评价营销效果的指标。近年来,随着智能化的快速发展,越来越多的企业希望借助机器学习的力量进行营销决策,但是传统的监督学习和非监督学习方法在处理该问题时只能最大化单个决策的即时收益,而直复营销需要随时间的推移进行连续决策,因而这两类方法具有很大的局限性。强化学习是机器学习的重要组成部分,主要用于解决序贯决策问题。它通过智能体持续地与环境进行交互,并从环境反馈的延迟奖赏中学
其他文献
本文的研究内容来源于国家自然科学基金面上项目“基于异构服务网络分析的Web服务推荐研究”。当前,随着信息技术与电子商务的发展,推荐系统逐渐成为电子商务技术的研究热点,其
随着信息时代的到来,网络上的信息资讯呈现爆发式增长。其中,微博以其交互性、实时性、原创性等特点迅速成为信息资讯传播的重要平台。在社会热点事件发生和传播的过程中,微博等
当前处理图像信息常基于PC机完成,但PC机体积庞大,不方便携带,且使用过程中,配套的电力设施、环境及其他资源要求较多,因此,在野外实时处理图像数据具有一定的难度。因此,本
随着互联网技术的迅速发展,视频点播、远程会议、在线教育和网络游戏等实时多媒体服务运用的越来越广泛,人们对网络应用的服务质量(Quality ofServices,缩写QoS)要求也随之增高。
无线传感器网络(WSN,Wireless Sensor Networks)的提出,是基于环境监测和目标追踪等一系列的实际应用需求。作为一种新兴的对环境和目标进行感知与探测的技术手段,如何提高WS
模型分割与形状对应是三维几何处理应用中两项重要的基础工作。本文介绍一种用于自由形态模型的基于等周划分的网格分割算法以及适用于CAD模型的面向特征线的形状对应算法。
目标跟踪是人机交互领域中的一个重要课题,但在实际跟踪中,目标容易受到遮挡等问题的影响,本文在分析总结已有工作的基础上,以提高遮挡等复杂环境下跟踪系统的性能为主要目标
随着互联网的迅猛发展,网络多媒体数据与日俱增,其中网络图像数据的增长尤为明显,仅仅在Facebook论坛上,每天就有超过3亿张图像被上传和分享。在淘宝网上,每天的在线商品数量大约
随着汽车行业的迅速发展,交通事故也在持续增长。为了解决这一问题,许多研究开始关注于驾驶行为的识别,以求理解事故发生的内在机制。同时,驾驶行为的研究,还能够为日益丰富的车载
1998年2月万维网联盟发布了一种名为XML(可扩展标记语言)的数据标准。由于它是标准通用标记语言SGML的子集,又是由W3C组织发布的,因此XML正逐渐成为信息世界数据交换的标准。在