摘要:
强化学习不需要具有先验知识,通过试错与环境交互获得策略的改进,具有自学习和在线学习能力,是构造智能体的核心技术之一。文中首先综述了强化学习模型和基本原理,然后介绍了强化学习的主要算法,包括Sarsa算法、TD算法、Q-学习算法及函数估计算法,最后介绍了强化学习的应用情况及未来研究方向。
中图分类号:
战忠丽, 王强, 陈显亭. 强化学习的模型、算法及应用[J]. , 2011, 24(1): 47-.
ZHAN Zhong-Li, WANG Qiang, CHEN Xian-Ting. Reinforcement Learning Model,Algorithms and Its Application[J]. , 2011, 24(1): 47-.