文件夹名称 | 说明 |
---|---|
ch01 | 第1章中使用的源代码 |
... | ... |
ch09 | 第9章中使用的源代码 |
common | 公用的源代码 |
notebooks | Jupyter Notebook形式的源代码 |
pytorch | 移植到PyTorch中的源代码 |
本书的代码也提供了Jupyter Notebook格式。通过点击下表中的按钮,应该可以在Google Colab或Kaggle Notebook等云服务上执行Notebook。
章 | Colab | Kaggle | Studio Lab |
---|---|---|---|
第1章 老虎机问题 | |||
第4章 动态规划法 | |||
第5章 蒙特卡洛方法 | |||
第6章 TD方法 | |||
第7章 神经网络和Q学習 | |||
第8章 DQN | |||
第9章 策略梯度法 |
本书中使用的Python版本和外部库如下所示。
- Python 3系列
- NumPy
- Matplotlib
- DeZero(或PyTorch)
- OpenAI Gym
本书将使用DeZero作为深度学习的框架,这个框架是我们在“深度学
习入门 & 进阶”系列的第三本书《深入学习入门2:自制框架》中创建的。(可以通过pip install dezero
进行安装)。DeZero是一个简单的框架,你应该很快就能掌握它。第7章对如何使用DeZero做了介绍。虽然本书使用的是DeZero,但使用其他框架(如PyTorch或TensorFlow)也不影响阅读本书。
DeZero和PyTorch的许多API是相同的。因此,可以很容易地将DeZero版的代码移植到PyTorch版的代码中。本书配套的 GitHub 仓 库(参见下文)也提供了 PyTorch 版的代码。
使用PyTorch的实现可以在pytorch目录中找到。
文件夹ch01到ch09中包含本书各章所使用的文件。要运行这些文件,请按以下方法执行Python命令(可以从任何目录中执行Python命令):
$ python ch01/avg.py
$ python ch08/dqn.py
$ cd ch09
$ python actor_critic.py
本仓库的源代码遵循MIT许可。无论商业或非商业用途,都可以自由使用。
本书的勘误信息汇总在勘误页面。
如果您发现任何未列在勘误页面上的错字或其他错误,请在勘误页面提交勘误。