pclgo的博客_CSDN博客

空空如也

深度强化学习 ( DQN )基本原理与AI项目实战

强化学习是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论，即有机体如何在环境给予的奖励或惩罚的刺激下，逐步形成对刺激的预期，产生能获得最大利益的习惯性行为。在强化学习的世界里，算法称之为Agent，它与环境发生交互，Agent从环境中获取状态（state），并决定自己要做出的动作（action）.环境会根据自身的逻辑给Agent予以奖励（reward）。奖励有正向和反向之分。比如在游戏中，每击中一个敌人就是正向的奖励，掉血或者游戏结束就是反向的奖励。【课程内容】强化学习简介强化学习基本概念马尔科夫决策过程 Bellman方程值迭代求解代码实战求解过程 QLearning基本原理 QLearning迭代计算实例 QLearning迭代效果求解流程详解 DeepQnetwork原理 DQN网络细节 DQN网络参数配置搭建DQN网络模型 DQN卷积操作定义数据预处理实验阶段数据存储实现训练模块 Debug解读训练代码完整代码流程分析 DQN效果演示

2018-03-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

pclgo的博客

空空如也

深度强化学习 ( DQN )基本原理与AI项目实战

Matplotlib 2.x By Example 原版图书讲解使用python中的Matplotlib绘制各种图表

Reinforcement Learning With Open AI, TensorFlow and Keras Using Python 强化学习原版书籍

Deep Learning with Python by Francois Chollet (final 版）

空空如也