• 博客(0)
  • 资源 (5)

空空如也

深度强化学习 ( DQN )基本原理与AI项目实战

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。 在强化学习的世界里, 算法称之为Agent, 它与环境发生交互,Agent从环境中获取状态(state),并决定自己要做出的动作(action).环境会根据自身的逻辑给Agent予以奖励(reward)。奖励有正向和反向之分。比如在游戏中,每击中一个敌人就是正向的奖励,掉血或者游戏结束就是反向的奖励。 【课程内容】 强化学习简介 强化学习基本概念 马尔科夫决策过程 Bellman方程 值迭代求解 代码实战求解过程 QLearning基本原理 QLearning迭代计算实例 QLearning迭代效果 求解流程详解 DeepQnetwork原理 DQN网络细节 DQN网络参数配置 搭建DQN网络模型 DQN卷积操作定义 数据预处理 实验阶段数据存储 实现训练模块 Debug解读训练代码 完整代码流程分析 DQN效果演示

2018-03-17

Matplotlib 2.x By Example 原版图书讲解使用python中的Matplotlib绘制各种图表

Matplotlib 2.x By Example 原版图书讲解使用python中的Matplotlib绘制各种图表,一书掌握图表绘制,绘制各种精美图表,进行数据分析。 出版日期: 2017年8月 主页:https://www.packtpub.com/big-data-and-business-intelligence/matplotlib-2x-example

2018-03-07

Reinforcement Learning With Open AI, TensorFlow and Keras Using Python 强化学习原版书籍

Apress Reinforcement Learning With Open AI Tensor 强化学习原版书籍, 作者:Abhishek Nandy Manisha Biswas

2018-03-07

Deep Learning with Python by Francois Chollet (final 版)

Deep Learning with Python by Francois Chollet (final 版),Manning | 2018 | ISBN: 9781617294433 | 386 pages | PDF

2018-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除