基于生成模型的Q-learning二分类算法

来源 :计算机应用研究 | 被引量 : 1次 | 上传用户:danycs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于二分类问题,基于判别模型的分类器一般都是寻找一条最优判决边界,容易受到数据波动的影响。针对该问题提出一种基于生成模型的Q-learning二分类算法(BGQ-learning),将状态和动作分开编码,得到对应各类的判决函数,增加了决策空间的灵活性,同时在求解参数时,采用最小二乘时序差分(TD)算法和半梯度下降法的组合优化方法,加速了参数的收敛速度。设计实验对比了BGQ-learning算法与三种经典分类器以及一种新颖的分类器的分类性能,在UCI数据库七个数据集上的测试结果表明,该算法有着优良的稳
其他文献
传统的矩阵分解算法在时间上将全部训练数据作为整体进行计算以获得用户兴趣特征,忽略了用户兴趣漂移问题。针对此问题,提出一种基于状态空间模型和概率矩阵分解的推荐算法。首先将用户兴趣特征向量与用户评分数据的矩阵分解映射到线性高斯状态空间中;然后使用EM算法和卡尔曼滤波器对模型参数进行动态求解;最后根据前后获得用户兴趣特征向量确认用户兴趣是否发生漂移,并进行相应推荐。实验结果表明,该算法与传统的矩阵分解推
目的分析标准创伤大骨瓣开颅手术治疗重型颅脑损伤的效果。方法抽选我院2015年2月—2017年4月收治的58例重型颅脑损伤患者,经随机数字表法分为对照组和观察组,各29例。对照组
传统序列到序列(seq2seq)模型未充分利用输入文本的句子结构,导致其无法生成结构严谨、语法更好的摘要,因此提出了一种融合句子基本结构的摘要生成方法。首先,明确提出融合句子结构生成文本摘要的概念。再者,在摘要生成器上增添了句子基本结构模块和监督模块,句子基本结构模块从输入文本中捕捉一系列句子结构,监督模块评估已捕获句子结构的重要性,以此协助句子基本结构模块从中提取可用的句子结构。最后,摘要生成器
传统协同过滤推荐算法存在时序性过低以及用户过多时数据稀疏相似用户计算复杂度高等问题。为此,提出融合最小哈希签名(MHS)与时序模型预测(AIM-RT)的谱聚类优化推荐算法。首先使用MHS与Levenshtein距离测度对用户—项目评分矩阵提取相似用户;然后利用时序模型进行权重拟合的AIM-RT预测算法预测评分补全相似用户稀疏矩阵;最后结合谱聚类进行相似用户优化,找到最优相似用户集合完成最终推荐。通
针对鲸鱼优化算法(WOA)容易陷入局部最优解、收敛速度慢等缺陷,提出一种基于小孔成像反向学习策略的鲸鱼优化算法。首先采用高斯映射生成的混沌序列取代原始算法中随机产生的初始种群,增加种群的多样性;其次,提出了一种小孔成像反向学习策略,并结合最优最差反向学习思想,增加了寻优位置的多样性,提高了算法跳出局部最优的能力;最后,在算法中加入了一个非线性收敛因子和一个对数形式的概率阈值,在保留鲸鱼算法优点的前
为加快推进绿色交通运输体系建设,通过借鉴国内外交通温室气体排放清单的研究和应用经验,分析了国内外城市客运温室气体排放清单的主要建立方法以及各方法的适用条件和主要特
介绍淮涟路互通工程护栏施工工艺流程,分析影响护栏质量及外观的因素.总结该类型护栏施工控制要点。此类型护栏已制构件线形平顺,成品质量可靠,抗冲击能力满足设计要求.在高速公路