专利权人:曲阜师范大学
1、本发明公开了一种采用资格迹的神经网络学习控制方法,具体涉及神经网络学习控制领域,它解决了将BP神经网络运用于强化学习中,效率低、速度慢、收敛效果差等问题。采用资格迹的神经网络学习控制算法,将BP神经网络应用于强化学习,BP神经网络的模型拓扑结构包括输入层、隐层和输出层,运用资格迹,本方法把局部梯度从输出层传递到隐层,实现隐层权值的更新,能大大提高学习效率;另外,在此基础上采用改进的残差梯度法,不仅对神经网络输出层进行权值更新,而且对隐层进行了优化权值更新,保证了BP神经网络在强化学习过程中良好的收敛性
具体了解该成果信息,请致电: