搜索筛选:
搜索耗时3.4691秒,为你在为你在102,285,761篇论文里面共找到 5 篇相符的论文内容
发布年度:
[期刊论文] 作者:方长胜,
来源:移动通信 年份:2003
...
[学位论文] 作者:方长胜,
来源:合肥工业大学 年份:2008
强化学习是机器学习的一个重要分支,它模拟动物学习过程,通过试探的方法修正从状态到动作的映射策略,最终学会在各种环境状态下采取最好的反应行为,从而提高智能系统的自适应...
[会议论文] 作者:方长胜,王浩,王池社,姚宏亮,
来源:中国仪器仪表学会第九届青年学术会议 年份:2007
基于部分可观察Markov决策过程(POMDP)的强化学习模型能有效地对动态决策问题进行建模,但精确求解最优策略是PSPACE难题,在直接逼近最优策略的近似求解方法中策略描述的复杂性随着问题规模的增大成指数增加。本文利用agent的内部状态(InternalState)来记忆agent......
[期刊论文] 作者:张润梅,王浩,张佑生,姚宏亮,方长胜,,
来源:计算机工程与应用 年份:2009
为了提高MPOMDP模型的知识表示能力和推理效率,提出一种基于Agent内部结构的MPOMDP模型。该模型能表示Agent的内部结构及其时间演化,并通过将系统联合概率分布表示成每个Agen...
[期刊论文] 作者:张润梅,王浩,张佑生,姚宏亮,方长胜,
来源:计算机工程与应用 年份:2009
为了提高MPOMDP模型的知识表示能力和推理效率,提出一种基于Agent内部结构的MPOMDP模型。该模型能表示A—gent的内部结构及其时间演化,并通过将系统联合概率分布表示成每个Agen...
相关搜索: