摘要:
提出了一种基于归一化径向基函数的自适应启发评价强化学习算法,用于异构无线网络系统中自主的动态频谱分配.该算法利用归一化径向基函数自适应构建状态空间,加快学习速度;利用自适应启发评价机制减少不必要的探索,提高学习效率.通过与无线环境交互,算法学会为不同接入网内的各个会话动态分配合适的频段.仿真结果表明,在同等网络条件下,该算法能获取更好的频谱利用率和服务质量,性能优于确定性频谱分配策略和一般的动态频谱分配策略.
中图分类号:
张文柱;邵丽娜. 异构无线网络中基于强化学习的频谱管理算法[J]. J4, 2011, 38(4): 32-37.
ZHANG Wenzhu;SHAO Lina. Dynamic spectrum allocation algorithm for heterogeneous radio networks based on reinforcement learning[J]. J4, 2011, 38(4): 32-37.