菜鸟果果-CSDN博客

原创【深度强化学习】深度Q网络DQN

[深度强化学习]DQN DQN是将深度学习和强化学习结合起来而实现从感知到动作的端对端的全新算法。深度Q学习的核心就是用一个人工神经网络q ( s , a ; θ ) , s ∈ S , a ∈ A来代替动作价值函数。 DQN的算法流程： Q-leaning和DQN的区别与Q-Learning相比，DQN主要改进在以下三个方面：（1）DQN利用深度卷积网络(Convolutional Neural Networks,CNN)来逼近值函数；（2）DQN利用经验回放训练强化学习的学习过程；（3）D

2022-02-11 21:48:45 2124

原创图卷积神经网络GCN

图卷积神经网络图卷积神经网络就是一种能对图数据进行处理的方法。如何理解图卷积算法？我们看动图分三步去理解（不同的节点有不同的权重）：第一步：发射（send）每一个节点将自身的特征信息经过变换后发送给邻居节点。这一步是在对节点的特征信息进行抽取变换。第二步：接收（receive）每个节点将邻居节点的特征信息聚集起来。这一步是在对节点的局部结构信息进行融合。第三步：变换（transform）把前面的信息聚集之后做非线性变换，增加模型的表达能力。 GCN，图卷积神经网络，实际上跟CNN的作用一样，

2022-02-11 21:48:06 910

原创【强化学习】Actor-critic演员评论家算法

强化学习演员评论家算法

2022-02-10 22:16:56 1605

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 【深度强化学习】深度Q网络DQN

原创 图卷积神经网络GCN

原创 【强化学习】Actor-critic演员评论家算法

空空如也

空空如也

原创【深度强化学习】深度Q网络DQN

原创图卷积神经网络GCN

原创【强化学习】Actor-critic演员评论家算法