基于生成模型的Q-learning二分类算法

来源 :计算机应用研究 | 被引量 : 1次 | 上传用户：danycs

【摘要】

：

对于二分类问题,基于判别模型的分类器一般都是寻找一条最优判决边界,容易受到数据波动的影响。针对该问题提出一种基于生成模型的Q-learning二分类算法(BGQ-learning),将状态和动作分开编码,得到对应各类的判决函数,增加了决策空间的灵活性,同时在求解参数时,采用最小二乘时序差分(TD)算法和半梯度下降法的组合优化方法,加速了参数的收敛速度。设计实验对比了BGQ-learning算法与三

【作者】

：

尚志刚徐若灏乔康加杨莉芳李蒙蒙

【机构】

：

郑州大学电气工程学院,河南省脑科学与脑机接口技术重点实验室

【出处】

：

计算机应用研究

【发表日期】

：

2020年11期

【关键词】

：

Q-LEARNING 生成模型二分类最小二乘时序差分算法半梯度下降法 Q-learninggenerative modelbinary classific

【基金项目】

：

国家自然科学基金资助项目(U1304602)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于状态空间模型和概率矩阵分解的推荐算法

传统的矩阵分解算法在时间上将全部训练数据作为整体进行计算以获得用户兴趣特征,忽略了用户兴趣漂移问题。针对此问题,提出一种基于状态空间模型和概率矩阵分解的推荐算法。首先将用户兴趣特征向量与用户评分数据的矩阵分解映射到线性高斯状态空间中;然后使用EM算法和卡尔曼滤波器对模型参数进行动态求解;最后根据前后获得用户兴趣特征向量确认用户兴趣是否发生漂移,并进行相应推荐。实验结果表明,该算法与传统的矩阵分解推

期刊

矩阵分解状态空间模型EM算法卡尔曼滤波matrix factorizationstate space modelEM algorithmKalman f

有机碳肥对花生肥效定位试验

期刊

花生碳肥肥效

水作“哲蓖三号”高产栽培技术优化数学模型

期刊

蓖麻哲蓖三号高产栽培数学模型

标准创伤大骨瓣开颅术对重型颅脑损伤的治疗作用分析

目的分析标准创伤大骨瓣开颅手术治疗重型颅脑损伤的效果。方法抽选我院2015年2月—2017年4月收治的58例重型颅脑损伤患者,经随机数字表法分为对照组和观察组,各29例。对照组

期刊

重型颅脑损伤标准创伤大骨瓣开颅术常规骨瓣开颅减压术临床疗效

融合句子结构的抽象式文本摘要方法

传统序列到序列(seq2seq)模型未充分利用输入文本的句子结构,导致其无法生成结构严谨、语法更好的摘要,因此提出了一种融合句子基本结构的摘要生成方法。首先,明确提出融合句子结构生成文本摘要的概念。再者,在摘要生成器上增添了句子基本结构模块和监督模块,句子基本结构模块从输入文本中捕捉一系列句子结构,监督模块评估已捕获句子结构的重要性,以此协助句子基本结构模块从中提取可用的句子结构。最后,摘要生成器

期刊

文本摘要监督模块句子基本结构模块摘要生成text summarizationsupervisor modulesentence structure mo

融合MHS与AIM-RT的谱聚类优化推荐算法

传统协同过滤推荐算法存在时序性过低以及用户过多时数据稀疏相似用户计算复杂度高等问题。为此,提出融合最小哈希签名(MHS)与时序模型预测(AIM-RT)的谱聚类优化推荐算法。首先使用MHS与Levenshtein距离测度对用户—项目评分矩阵提取相似用户;然后利用时序模型进行权重拟合的AIM-RT预测算法预测评分补全相似用户稀疏矩阵;最后结合谱聚类进行相似用户优化,找到最优相似用户集合完成最终推荐。通

期刊

推荐算法最小哈希签名时序模型权重拟合谱聚类recommendation algorithmminimum hash signaturetiming m

油用甘蓝型油菜花前生长发育对花的发育过程,干物质分配及籽粒产…

期刊

油菜生长发育籽粒产量

基于高斯映射和小孔成像学习策略的鲸鱼优化算法

针对鲸鱼优化算法(WOA)容易陷入局部最优解、收敛速度慢等缺陷,提出一种基于小孔成像反向学习策略的鲸鱼优化算法。首先采用高斯映射生成的混沌序列取代原始算法中随机产生的初始种群,增加种群的多样性;其次,提出了一种小孔成像反向学习策略,并结合最优最差反向学习思想,增加了寻优位置的多样性,提高了算法跳出局部最优的能力;最后,在算法中加入了一个非线性收敛因子和一个对数形式的概率阈值,在保留鲸鱼算法优点的前

期刊

鲸鱼优化算法高斯映射小孔成像反向学习概率阈值非线性收敛因子WOAGauss mapsmall hole imaging reverse learnin

城市客运温室气体排放清单建立方法与实证研究

为加快推进绿色交通运输体系建设,通过借鉴国内外交通温室气体排放清单的研究和应用经验,分析了国内外城市客运温室气体排放清单的主要建立方法以及各方法的适用条件和主要特

期刊

绿色交通城市客运温室气体排放清单排放因子green transportation urban passenger transport greenhou

F型墙式钢筋混凝土护栏施工及控制

介绍淮涟路互通工程护栏施工工艺流程，分析影响护栏质量及外观的因素．总结该类型护栏施工控制要点。此类型护栏已制构件线形平顺，成品质量可靠，抗冲击能力满足设计要求．在高速公路

期刊

F形墙式护栏施工控制F-shaped wall guardrail construction control

基于生成模型的Q-learning二分类算法

与本文相关的学术论文