自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 最优控制 3:最优控制理论中的极小值原理与动态规划

tf​tf​。

2023-04-14 15:29:46 1979

原创 最优控制 2:使用变分法求解最优控制问题

使用变分法求解最优控制问题

2023-04-08 14:44:32 516

原创 最优控制 1:最优控制中不同情形下泛函取到极值的必要条件

最优控制中不同情形下泛函取到极值的必要条件最优控制中不同情形下泛函取到极值的必要条件引言一般问题1. t0t_0t0​ 固定,t1t_1t1​ 固定,x0=x(t0)x_0=x(t_0)x0​=x(t0​) 固定,x1=x(t1)x_1=x(t_1)x1​=x(t1​) 固定2. t0t_0t0​ 固定,x0=x(t0)x_0=x(t_0)x0​=x(t0​) 固定,t1t_1t1​ 自由,x1=x(t1)x_1=x(t_1)x1​=x(t1​) 自由3. t0t_0t0​ 固定,x0=x(t0)x_0=x

2023-04-05 22:10:39 858

原创 四旋翼无人机建模 (附github源代码)

https://github.com/ReinforcementLearning-StudyNote/ReinforcementLearning

2023-02-16 17:42:03 2525

原创 强化学习保守策略迭代Conservative policy iteration推导

强化学习保守策略迭代Conservative policy iteration推导

2022-11-01 15:10:37 437

原创 强化学习自然策略梯度Natural Policy Gradient推导

强化学习自然策略梯度Natural Policy Gradient推导学习笔记。

2022-10-24 15:44:26 790 4

原创 强化学习策略梯度定理证明

强化学习策略梯度定理证明

2022-10-15 20:40:24 592

原创 强化学习DDPG算法

强化学习DDPG算法前言因为疫情一直在辗转隔离,没心思学习,索性整理一下学过的东西,就当自我安慰了。DDPG基本原理流程图一些小细节局限性

2022-06-07 19:53:44 1803 8

原创 Ubuntu18.04(非虚拟机)下Anaconda3 + CUDA + cudnn + PyTorch(GPU)安装记录

目录前言0. 台式机配置1. Anaconda3 安装2. CUDA安装2.1. 卸载NVIDIA显卡驱动2.2. 禁用自带nouveau驱动2.3. 重新安装NVIDIA驱动2.4. CUDA安装2.5. CUDA测试cudnn安装安装cudnn测试PyTorch(GPU)安装安装测试前言由于台式机电脑刚刚增加了一块500G的固态硬盘,所以直接把Ubuntu18.04装在整块硬盘里面了,然后原来的存储全部分给WIN10,这样的话便于管理。重新刷过Ubuntu,第一件事肯定就是安装各种各样的开发平台。

2021-10-17 17:32:23 770

原创 联想拯救者Y7000P装win10与Ubuntu18.04双系统

初衷写这个博客的初衷是为了记录本人在联想笔记本上安装Ubuntu18.04双系统时遇到的坑,事后装完之后发现并不是很坑,但是如果没有遇到过此类问题,就很难受了,所以决定记录下来。这款笔记本安装好双系统之后会出现无法进入系统的问题,主要表现可能为以下几点中的一个:在登录界面无限循环 无法进入登录界面,直接在系统启动时卡死,界面如下 (这谁扛得住啊...T_T)。最开始我以为是联想的问题,因为我之前的DELL笔记本从来没有出现过任何问题,无论中文系统还是英文系统都特别顺利。但是后来发现这个锅

2021-10-01 11:27:13 1579 2

原创 强化学习Q-Learning算法

强化学习Q-Learning算法前言基本概念基本概念递推关系前言学习这个算法有一段时间了,但是因为自己犯懒一直没有整理。现整理一下,一方面有刚入门的同学可以参考,另一方面哪里写错或者理解不深的还请大家及时指正。基本概念基本概念首先列出一些强化学习中的基本概念,主要是为了帮助自己回忆起学习这个算法的过程。状态值函数:智能体在状态 sss 处的累计回报的期望值被称为智能在在采用策略 π\...

2020-03-19 20:01:49 1964

原创 高斯过程回归中后验概率的简单推导

最近几天在整理高斯过程回归(Gaussian Process Regression, GPR)部分的知识,虽然还有很多问题没有搞懂,但是有一点进展还是决定总结下来,防止遗忘。在整理之前,先列出我参考的几个资料吧,一方面方便大家参考,另一方面也防止自己以后找不到了。哔哩哔哩视频:https://space.bilibili.com/97068901/video。里面有很多推导,其中一个就是G...

2019-08-09 20:45:34 7942 5

原创 Ubnutu16.04 系统下编译PX4固件方法

  今天开始准备在Ubuntu16.04下搭建PX4的开发环境。早就听说源代码编译的过程中有很多坑,所以在编译源代码之前在网上搜索了很多教程,其中这个教程写的非常详细:                https://blog.csdn.net/pix_csdn/article/details/81913610  这篇博客是2018年8月的,想起自己曾经在2018年5月左右配置过相同的开发环...

2019-07-17 18:00:34 1346 2

原创 Pycharm在windows下使用Anaconda中的Python解释器各种报错的问题

最近几天被windows下的软件快要搞疯了。电脑装了Anaconda3,在运行一些python程序的时候,这些程序在anaconda的自带终端中python代码可以正常运行。但是不可以使用诸如Pychrm和VS2017这种windows下非常好用的IDE开发工具。 错误类型比较经典,都是提示找不到mkl_inter_thread.dll或者找不到其他的什么别的dll。...

2019-07-16 12:56:06 2685 4

原创 使用Pycharm创建一个工程

刚刚开始学习Python,使用的IDE是PyCharm。本来想记在本子上,可是感觉有点慢,而且多,因此选择在网上记录自己的笔记。哈哈,也不知道能记多长时间。PyCharm下载安装之后是需要破解的,CSDN上面有很多特别详细的教程。(我选择的是使用破解文件那种)接下来就是新建工程,打开PyCharm,出现这个界面:       选择Create New Project -> P...

2018-09-25 22:24:17 10172 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除