【摘 要】
:
针对深度确定性策略梯度算法(DDPG)中的经验回放机制,提出了一种综合了高优先级数据重播和高相似度数据剪枝,并对送入网络训练的样本数据进行处理的方法。针对先进先出存储方法和重放缓冲区中随机采样方式造成经验回放效率较低的问题,提出了解决方案:选择高优先级样本送入网络进行训练,同时移除缓冲区中的相似度较高的样本并保留一些罕见的样本。通过相关实验表明,方法不仅可以在更短的训练时间内达到更好的性能,而且可
【机 构】
:
桂林电子科技大学计算机与信息安全学院
【基金项目】
:
国家自然科学基金(61262074)。
论文部分内容阅读
针对深度确定性策略梯度算法(DDPG)中的经验回放机制,提出了一种综合了高优先级数据重播和高相似度数据剪枝,并对送入网络训练的样本数据进行处理的方法。针对先进先出存储方法和重放缓冲区中随机采样方式造成经验回放效率较低的问题,提出了解决方案:选择高优先级样本送入网络进行训练,同时移除缓冲区中的相似度较高的样本并保留一些罕见的样本。通过相关实验表明,方法不仅可以在更短的训练时间内达到更好的性能,而且可以加快训练过程,提高学习稳定性和长期记忆能力。
其他文献
在WSNs网络规模不断扩展的同时,路由协议与节点复杂度随之升高,导致WSNs网络中链路故障概率的增加。现有方法普遍存在链路故障检测误差偏大,网络恢复效果不佳等问题。为此提出了基于布尔方程与数据分析的大规模WSNs链路故障恢复方法。根据WSNs链路的能量特征构建测试信号的布尔映射关系,依据路径与链路的布尔状态向量搜索故障链路最小值,利用线性规划与约束条件求解布尔方程,从而确定故障链路。根据WSNs链
针对基于卷积神经网络的胶囊内镜图像分类算法上存在模型参数难以训练、易过拟合的问题,提出一种基于迁移学习的胶囊内镜图像分类算法。先对胶囊内镜图像进行预处理和数据扩增;利用经典卷积神经网络Alexnet、Googlenet、 Inception-v3提取囊内镜图像的深层特征;最后将3个模型提取的特征向量加以融合,作为支持向量机的输入进行训练和分类。实验结果表明,提出的方法分类准确率为99.98%、特异
当前的非授权代码的检测过程忽略了获取线性特征集,代码类型无法得以高精度匹配,导致传统方法出现检测准确率低、耗时长问题。为解决以上问题,提出基于线性特征集的非授权代码敏感路径检测方法。引入深度学习,设计非授权代码特征检测步骤。以非授权代码为目标样本,基于线性特征集判断非授权代码敏感路径判断,利用深度学习提取正常代码样本的函数图特征,并设置阈值,实现非授权代码敏感路径的检测。实验结果表明:与传统方法相
由于传统离群点检测方法未对离群点进行判定,从而导致出现了检测速度慢、检测误差大的问题,为此提出一种海量不确定数据集中离群点快速检测的方法。优先判定出不确定数据集中的离群点,利用点排序识别聚类结构(Ordering points to identify the clustering structure)算法完成,确定待检测离群点所需参数,计算出离群点的离群属性,根据离群属性计算结果,引入邻域密度构建
根据传统的水平集方法,在图像分割时,很难准确分割灰度不均衡的图像。提出了一种基于视觉显著性的变分水平集图像分割方法。通过Lab颜色空间建立视觉显著性数据模型,加强图像对比度,提取视觉显著性区域,随后对此区域图像做去燥处理,防止图像内细节信息的丢失。再利用无需初始化的变分水平集,结合能量函数完成内部能量的约束,得到曲线演化的偏微分方程,通过最小值能量函数,完成图像分割。仿真结果表明:所提方法解决了图
为了解决对人体动作局部特征点的识别误差率较高的问题,提出一种基于机器学习的人体动作局部特征点识别方法。首先利用人体在时空状态下的差别及运动频率变化,构建多尺度的局部时空领域特征。以目标之前状态为基础,通过卡尔曼滤波计算法对人体关节位置评估,并对之后的状态做误差最优估计,以此构建人体行为数学模型。利用小波转换函数构建神经网络模型,将之前所提取出来的人体动作特征点参数作为输入神经元,输入进神经网络内进
目前医学资源信息聚类方法由于没有对特定信息进行去噪,使细节信息流失,无法保留有效信息,导致Jaccard系数与F1系数偏低,特定信息聚类效果较差的问题。为解决上述问题,提出基于VSM的海量医学资源特定信息优化聚类模型,采用有标记医学信息与无标记医学信息样本中所包含的信息,设置降维目标函数的参数值,通过建立降维矩阵实现医学资源特定信息降维处理;利用小波变换模极大值对医学资源特定信息去噪处理,在去噪过
由于非结构化大数据不存在固定控制中心,会严重影响云存储阶段稳定性,因此,以非结构化大数据为研究目标,构建一种云存储稳定性优化方法,并通过仿真加以效果评定。根据架构的不同环状态消耗能量计算方法,最小化非结构化大数据的云存储能量消耗,将优化核心设定为最大化云存储环活动时间,按照内部节点、边界节点编号顺序,完成所有区域云存储平衡函数的并行架构,通过制定约束条件,引入利用概率期望值与弹性期望值,采用存储梯
非结构化数据存在差异性,对标注模型的构建存在不足,影响标注质量。提出基于多通道卷积神经网络的非结构化数据标注方法。建立Hive分布式查询框架,对其中与标注目标相关的数据进行相似性查找,同时建立众包标注集,确定相关标注概念。对标注集中的标注差异性,利用多通道卷积神经网络对其差异性进行确认,并确定标注任务函数。利用标注任务函数,建立任务标注模型,利用模型中求得函数解值完成标注任务。为了验证设计的非结构
针对目前算法在多节点信息资源分配推荐时,未对多节点信息资源进行相似性计算,导致多节点信息资源分配时间长,信息资源分配正确率和推荐列表覆盖率较低的问题,提出基于协同过滤的多节点信息资源分配推荐算法。采用协同过滤算法,整合处理节点信息资源,构建信息数据评分模型,运用评分模型,查找节点信息数据的最近邻居集进行预测评分,利用相似性计算,完成多节点信息分类。根据二部图网络结构,资源分配分类节点信息,生成推荐