我终于用了 tensorflow 了,做了点深度强化学习(Deep Reinforcement Learning)
两年前看到了一位叫做 Yilun Du 的麻省理工计算机博士生,两次国际生物奥赛金牌得主(美国队)的文章,链接为 https://yilundu.github.io/2016/12/24/Deep-Q-Learning-on-Space-Invaders.html 。他写了一个简单但好用的用于深度强化训练 Atari 游戏 Space Invaders 的小框架,用了 openai 的 gym。gym 简而言之是个游戏模拟器,游戏中对应于不同态 (state) 的奖励 (reward) 参数都包含在里面了。
他的那篇博文也相对通俗易懂,把里面用的深度强化学习策略的讲的很清楚。之前,我大概
我没做多少,就把 Yilun Du 的代码移植到了 Windows 和 Keras 2+, Tensorflow 2+,看似现在 Tensorflow 1 基本不支持了,注意到 Yilun Du 这个是在 2016 年 12 月做的,两年半前。我的大部分时间或许都花在了安装和诊断,剩下的大多在把卷积神经网
训练仅仅用了 CPU,我的 Windows 7 的 GPU 是因特尔而非英伟达的,所以还没有安装 CUDA 及 tensorflow-gpu,不过假设读者有符合要求的计算机设备,欢迎试一试。
以下是我的 fork 了 Yilun Du 的代码仓,Windows 的安装步骤都记载在里面了,安装花俩小时应该就可以跑起来了。当然,国内的人如果无法