《强化学习精要 核心算法与TensorFlow实现》【1】

 

 

 

 

 

 

 

  

 

 

 

 

 

 

 

 

  

 

 

 

 

 

 

 

 

 

 

 

 -->

不一定要沿梯度方向下降?

通过不同的方向 来探测/估计当前地形?

 

-->

如何衡量 zigzig 的程度——如果从历史的迭代中学习掌握规律?

 

--> 

动量方法 --> 数据驱动~ 每个方向算一个偏导数,根据偏导数来决定当前的方向

步长呢?——可以动量方法一把?dogleg 方法试探性地步长减半?

 

 

 

 

 

 

 

 

 

 

  

 

 

 

 

 

<style></style> <style></style> <style></style>

相关文章

MNIST数据集可以说是深度学习的入门,但是使用模型预测单张M...
1、新建tensorflow环境(1)打开anacondaprompt,输入命令行...
这篇文章主要介绍“张量tensor是什么”,在日常操作中,相信...
tensorflow中model.fit()用法model.fit()方法用于执行训练过...
https://blog.csdn.net/To_be_little/article/details/12443...
根据身高推测体重const$=require('jquery');const...