搜索与方长胜相关的论文

搜索筛选:

搜索耗时3.4691秒,为你在为你在102,285,761篇论文里面共找到 5 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 更早

排序方式:

相关性最新发表最早发表

基于GPRS的地理信息系统应用研究

[期刊论文] 作者：方长胜, 来源：移动通信年份：2003

...

下载此文

[学位论文] 作者：方长胜, 来源：合肥工业大学年份：2008

强化学习是机器学习的一个重要分支,它模拟动物学习过程,通过试探的方法修正从状态到动作的映射策略,最终学会在各种环境状态下采取最好的反应行为,从而提高智能系统的自适应...

下载此文

POMDP中基于内部状态的多agent强化学习

[会议论文] 作者：方长胜,王浩,王池社,姚宏亮, 来源：中国仪器仪表学会第九届青年学术会议年份：2007

基于部分可观察Markov决策过程(POMDP)的强化学习模型能有效地对动态决策问题进行建模,但精确求解最优策略是PSPACE难题,在直接逼近最优策略的近似求解方法中策略描述的复杂性随着问题规模的增大成指数增加。本文利用agent的内部状态(InternalState)来记忆agent......

下载此文

基于内部结构MPOMDP模型的策略梯度学习算法

[期刊论文] 作者：张润梅,王浩,张佑生,姚宏亮,方长胜,, 来源：计算机工程与应用年份：2009

为了提高MPOMDP模型的知识表示能力和推理效率,提出一种基于Agent内部结构的MPOMDP模型。该模型能表示Agent的内部结构及其时间演化,并通过将系统联合概率分布表示成每个Agen...

下载此文

基于内部结构MPoMDP模型的策略梯度学习算法

[期刊论文] 作者：张润梅,王浩,张佑生,姚宏亮,方长胜, 来源：计算机工程与应用年份：2009

为了提高MPOMDP模型的知识表示能力和推理效率，提出一种基于Agent内部结构的MPOMDP模型。该模型能表示A—gent的内部结构及其时间演化，并通过将系统联合概率分布表示成每个Agen...

下载此文