自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 【深度强化学习】深度Q网络DQN

[深度强化学习]DQN DQN是将深度学习和强化学习结合起来而实现从感知到动作的端对端的全新算法。 深度Q学习的核心就是用一个人工神经网络q ( s , a ; θ ) , s ∈ S , a ∈ A来代替动作价值函数。 DQN的算法流程: Q-leaning和DQN的区别 与Q-Learning相比,DQN主要改进在以下三个方面: (1)DQN利用深度卷积网络(Convolutional Neural Networks,CNN)来逼近值函数; (2)DQN利用经验回放训练强化学习的学习过程; (3)D

2022-02-11 21:48:45 2124

原创 图卷积神经网络GCN

图卷积神经网络 图卷积神经网络就是一种能对图数据进行处理的方法。 如何理解图卷积算法? 我们看动图分三步去理解(不同的节点有不同的权重): 第一步:发射(send)每一个节点将自身的特征信息经过变换后发送给邻居节点。这一步是在对节点的特征信息进行抽取变换。 第二步:接收(receive)每个节点将邻居节点的特征信息聚集起来。这一步是在对节点的局部结构信息进行融合。 第三步:变换(transform)把前面的信息聚集之后做非线性变换,增加模型的表达能力。 GCN,图卷积神经网络,实际上跟CNN的作用一样,

2022-02-11 21:48:06 910

原创 【强化学习】Actor-critic演员评论家算法

强化学习演员评论家算法

2022-02-10 22:16:56 1605

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除