自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(114)
  • 问答 (1)
  • 收藏
  • 关注

原创 PyTorch torch.nn.functional.one_hot用法解析

num_classes,pytorch默认将a中最大值加1作为标签类别最大数,此时最后一维就等于该最大值。例如,a中最大值是2,标签类别最大数就是2+1=3,那么b的形状就是(1,3,3)假设输入的张量维度是n,那么输出张量维度就是n+1,而且多的这一维度是加在了最后一维。例如,输入张量是1维的,经过。其实说白了最后一维就等于num_classes,区别只在于num_classes是否被提前指定而已。num_classes,此时最后一维就等于num_classes,那么b的形状就是(1,3,4)

2024-04-15 16:27:39 131

原创 Pycharm2023同时并行多个.py文件

3.还是在 Edit Configurations界面,去左下角找到“Edit Configurations templates”,点击进入后,同样去设置勾选“Allow multiple instances”2. 对于每个想要并行运行的文件,点击右上角“Modify options”,勾选“Allow multiple instances”1.点左上角的“Run”,找到“Edit Configurations”,点击进入。

2024-04-10 12:08:57 127

原创 from import导入文件报错Unresolved reference

同一个文件夹下,想在A文件中导入B文件中的模块,用了from import就会报错Unresolved reference,查了半天资料,用了各种方法没用。最后的解决方法:改文件名字。具体来说,B文件的名字是SAC-continuous,我改成SAC后,就能正常导入了。

2024-01-11 12:19:12 358

原创 airlearning-ue4安装的踩坑记录

严格按步骤2和步骤3进行,记得步骤3一定不能省(右键“build.cmd”文件,选择“编辑”),否则你把build好的Airsim插件放到airlearning-ue4里时,就会出现Airlearning无法被编译的错误!VS: Visual Studio Community 2017 (Version 15.9.58),记得安装时选上Windows 8.1 SDK。操作系统:Win10。

2023-11-19 11:28:04 593 6

原创 Pytorch训练深度强化学习时CPU内存占用一直在快速增加

说白了,就是经验池的存储函数,也就是因为一直往经验池里加数据导致内存增加。想了想,原来是我最近修改了算法输入,把图像作为状态输入的一部分了,此外换了配置更好的电脑,程序运行速度也提升了。二者综合作用下,内存才会有明显增加,从而被我发现!(我真是脑子抽了,这么简单的问题一直没想到。最近在用MATD3算法解决多机器人任务,但是在训练过程中,CPU内存一直在增加(注意,不是GPU显存)。我很头疼,以为是算法代码出了问题,导致了内存泄漏,折腾了1天也没解决。解决方法:终极方法就是换大内存。

2023-10-19 11:17:44 1912 1

原创 强化学习输入数据归一化(标准化)

3.对于动作来说:在动作空间是连续的情况下,一个设计得好的环境,其 action 的均值方差最好接近0和1。除此之外,还看到另一种方式:在训练开始前,用随机动作与环境交互数个回合,然后用这个过程中获得的状态信息去计算均值和方差来做为本次训练的唯一归一化参数。2.若输入是普通的数值(非图像),归一化的方式为:每一次训练前对经验池所有的数据算固定的均值和方差来做为本次训练的唯一归一化参数。1.若输入状态是图像或者包含图像,那么针对图像信息,常见的归一化方式是除以255,效果与减去均值,除以方差的效果接近。

2023-09-10 17:24:25 1034 1

原创 CSDN打不开或者加载缓慢的解决方法(亲测有效)

最后说下加载缓慢的原因:可能是本地网络节点问题,过段时间应该就会正常。(确实,我发现每隔一段时间CSDN就会抽风几天,加载不出来。PS:我用的是谷歌浏览器,如果你跟我用的不一样的浏览器,那可能上述方法得变变~(图片是CSDN主页)

2023-05-10 15:38:14 1952 1

原创 关于归纳偏置(inductive bias)的一点简单理解

简单理解,就是根据你的先验知识,对某件事做出假设,即inductive bias==假设。例如,alphago在解决围棋问题时,可以用CNN解决,这就是人的先验假设;再举个例子理解:inductive bias就像学生在考试前预测可能考到的题目类型,这有助于他们更好地准备考试,但如果预测错误,可能会适得其反。inductive bias:归纳偏置或者归纳偏差,指学习算法在从有限数据中推断出一般性规律时所做出的先验假设或限制,可以帮助学习算法在面对新数据时进行推理和泛化,并优先考虑具有某些属性的解。

2023-04-28 14:55:08 516

转载 CSDN 访问慢解决办法

今天突然发现百度搜索出来的CSDN博客列表,点进去之后网页加载很慢,要等个一两分钟才显示页面,而且没有样式效果,排版很乱。这可不行啊,CSDN平时还是挺好用,展示的博客内容还是很大程度上帮助人解决问题。F12打开浏览器控制台一看,资源文件要么Pending要么Faild本地用控制台Ping了一下发现就不进行了,链出来的IP地址都不太了解也不太熟,大致看着是机顶盒的运营商问题(不是很肯定,猜的)......

2022-07-18 10:46:25 2022

原创 Airsim使用过程中需要注意的问题记录(持续更新)

由于我主要做多UAV研究,因此记录的问题都是与此相关的~~1.对于多UAV场景,由于在setting文件中,每个UAV的初始位置都不一样,因此在用getMultirotorState函数获取UAV状态信息时,需要在当前坐标后在加上其初始坐标。这是因为getMultirotorState函数获得的坐标是相对于每个UAV自己的初始位置的,因此需要将它们转换到统一的坐标系下,方便使用2.对于多UAV场景,moveToPositionAsync函数中的位置参数,也是相对于自己的初始位置的,因此在某些情况下也

2022-05-26 16:15:37 374

原创 关于人工势场法的资料记录

1.机器人规划算法——人工势场法 - 知乎2.第四章、移动机器人的路径规划4_@想念你的笑的博客-CSDN博客3.基于信息一致性的多无人机编队控制方法研究 - 中国知网4.路径规划与轨迹跟踪系列算法学习_第6讲_人工势场法_哔哩哔哩_bilibili...

2022-05-26 11:48:49 174

原创 UE4使用过程中的问题记录

1.我用C++创建了一个actor类,类里面写了关于actor运动速度的一些信息。我把这个类放到两台不同的电脑运行时,发现它们在UE4中运动的速度不一样,造成这种现象的原因可能是什么?跟电脑显示器的刷新频率有关吗?(我的两台电脑显示器配置不同)?同样的代码为什么会有不同的运动速度?下面是我的部分代码。答:以我的代码来说,确实跟电脑显示器的刷新频率有关。关于如何查看UE4的帧数(fps),可以用“~”键呼出UE4的控制台,然后输入stat fps命令就可以了。至于如何解决这个问题,可以用“t.max.

2022-04-13 11:51:35 996

转载 强化学习中的重要性采样(Importance Sampling)

转自:强化学习中的重要性采样(Importance Sampling) - 知乎

2022-04-02 20:27:58 594 1

原创 关于Pytorch中dim使用的一点记录

pytorch的许多函数,例如torch.cat()、torch.max()、torch.mul()等,都包含了dim参数。关于dim这个函数,我想许多人跟我一样,一知半解,比较模糊,下面我就把自己关于dim的一点看法记录下来,供大家参考,欢迎各位大佬批评指正。1.关于dim的取值这一点很多博客都没有说清,大家可能大概知道dim可以取0,1,-1这些值。那么dim还能取其他值吗?具体的规则是什么呢?不同值代表的不同含义又是什么?A.关于dim 取值范围:假设有一个n维的tensor,那么它的di

2022-03-22 20:17:37 1679 1

原创 深度强化学习中带有阴影的曲线是怎么画的?

记录学习一下:1.强化学习论文里的训练曲线是用什么画的?如何计算相关变量 - 深度强化学习实验室2. 论文中画带标准差阴影的曲线图:seaborn.lineplot()_条件反射104的博客-CSDN博客

2022-03-17 19:36:53 5153

原创 关于KL散度的一点记录

1.首先按顺序弄清以下概念:概率,信息,信息熵,交叉熵,相对熵(KL散度),可以参考: KL-Divergence详解 - 知乎2.信息熵中log的底数一般是2,但一般在神经网络中,默认以ee为底,这样算出来的香农信息量虽然不是最小的可用于完整表示实践的比特数,但对于信息熵的含义来说是区别不大的,只要这个底数大于1,就可以表达信息熵的大小。可以参考: 信息熵与相对熵(KL散度) - 知乎3.KL散度的作用:用于衡量两个概率分布间的差异。信息论中,KL散度等价于...

2022-02-24 11:01:35 1373

原创 人工势场寻路算法

相关资料,备忘:https://github.com/ShuiXinYun/Path_Plan/tree/d9707334af7451c361776d07791151b3b09976c9https://medium.com/nerd-for-tech/local-path-planning-using-virtual-potential-field-in-python-ec0998f490afArtificial Potential Field - python codeht...

2022-01-24 11:16:17 431

原创 指示函数(样子像空心1的一个数学符号)

最近看文献,发现一个符号:没见过这个长得像空心1的数学符号,查了一下 ,记录下备忘:指示函数(indicator function),含义是:当输入为True的时候,输出为1,输入为False的时候,输出为0。具体来说,在上面的公式中,指示函数后面的内容如果为真,那就返回1;否则返回0。...

2022-01-13 11:42:53 9482 11

原创 matplotlib 绘图部分知识点记录备忘

如何画圆?1.matplotlib绘图实例:pyplot、pylab模块及作图参数_皮皮blog-CSDN博客_matplotlib.pylab2.如何用python画圆?使用什么函数来画?-Python学习网3.plt.scatter()_coder-CSDN博客_plt.scatter4.Python 如何绘制圆,Python绘制圆(超棒!!)_petermsh的专栏-CSDN博客_python怎么画圆5.matplotlib 绘制 矩形,圆形_dss875914213的博客-...

2022-01-04 10:11:47 1537

转载 UE4 开启重力穿透碰撞障碍物解疑

问题:模型没有添加collison ?如果没有添加collison,在UE4当中有2中方式可以使其带有碰撞属性,如图1.在设置中,选择UseComplexCollisionAsSimple, 就是第三个然后该模型在场景中是具有碰撞的。如果选择第二个的话(UseSimpleCollisonAsComplex), 场景中直接被其他物体穿透。2.将Collision Complexity设置为Default, 然后直接给模型添加一个Collsion, 这个使其带有.

2021-12-28 16:48:59 1346

原创 Github中提交discussion时,如何格式化的插入代码?

1.如果是插入单行代码,就用单个倒引号(就是键盘上ESC下面那个按键)包围起来,例如:`你的代码`2.如果是插入一段代码,就用单三个倒引号包围起来,例如:```一段代码```更多用法见:Basic writing and formatting syntax - GitHub Docs...

2021-12-25 16:44:38 1863

原创 DDPG或TD3算法训练时总是输出边界值问题记录

最近在使用stable-baselines3框架中的DDPG算法时,发现一个问题:只要算法探索步数达到learning_starts,一开始学习,actor网络很快就会输出动作边界值,然后就保持不变,一直输出同样的边界值。后来换了TD3,发现也会出现这个问题,于是就上网查找解决方案,发现很多人都有这个问题,但是都没解决。下面我从自己的经验出发,结合网上其他人的分析,给出造成这个问题可能的原因以及解决方案:1.如果你的actor网络输出使用tanh函数,那么一个很大的可能性就是预激活变量(输入tanh的)

2021-12-18 12:01:37 7717 27

原创 anaconda在安装依赖:pip install -r requirements.txt 执行命令时报错的解决办法

问题:我用anaconda创建了一个新环境,并想用pip install -r requirements.txt安装依赖。在我切换到新环境,并把requirements.txt放到新环境的文件路径下后,执行命令,发现报错:ERROR: Could not open requirements file: [Errno 2] No such file or directory: 'requirement'解决办法:把requirements.txt放到“C:\Users\你的用户名”的路径下,如图:

2021-12-09 11:45:43 5263 4

转载 深度学习 | 三个概念:Epoch, Batch, Iteration

看到一篇文章写的很清楚,分享一下:深度学习 | 三个概念:Epoch, Batch, Iteration - 简书

2021-11-22 16:49:45 138

原创 Python numpy数组中冒号的使用

冒号主要用于数组的索引,具体来说有以下两个作用:只有一个冒号,就代表全部选择,如x[1,:] 取指定范围的元素,如x[1,m:n]下面通过例子简单理解下:首先创建随机数组:然后进行索引操作:对于只有一个冒号的情况,如x[1,:],就是取第一行的所有列的元素,即:对于指定范围的情况,如x[1:4,2],就是取第2列中的第一行到第三行的所有元素,即:注意:X[:, m:n]即取矩阵X的所有行中的的第m到n-1列数据,含左不含右...

2021-11-22 15:42:56 2940

原创 Python基础-类变量和实例变量

备忘:Python基础-类变量和实例变量 - 珞樱缤纷 - 博客园python——类中的self到底有什么作用 - jvincent - 博客园#深入剖析# Python中 __init__ 函数 内外 定义类的变量的区别_lch551218的博客-CSDN博客

2021-11-19 21:07:24 596

原创 安装Pytorch后torch.cuda.is_available()返回False问题解决

首先说几点安装Pytorch时需要注意的点:1.如果有能力,最好在科学上网后,利用类似如下命令直接安装:conda install pytorch torchvision torchaudio cudatoolkit=11.3这里注意:上述命令行最后没有-c pytorch,这点与官网的不一样,官网给出的是这样的:加上-c pytorch的意思好像是从清华源下载~~2.如果能力不足,无法科学上网,则需要手动切换镜像源了,比如切换清华源:conda config --add .

2021-10-26 16:21:48 19532 19

原创 QQ群文件加载不出来问题的解决办法

最近给电脑连了网线,然后用了学校给的网络配置,就是ip和dns这些东西。连上网之后,发现登录不上QQ,在网上找了半天解决办法,最后解决了,详情看:关于QQ登录超时70001问题的解决办法_Coder_Jh的博客-CSDN博客。QQ可以正常登录之后,发现群文件又打不开了:就是这个东西,怎么也刷新不出来,把我整郁闷了。又在网上查了半天,发现可能是dns设置的问题,最终捣鼓一阵后,成功解决,方法如下:1.打开网络的属性,找到IPV4设置,打开它;2.将首选DNS和备选DNS分别替换为腾讯.

2021-09-16 16:00:14 29235 14

转载 关于QQ登录超时70001问题的解决办法

前几天电脑系统重装后QQ就登录不了了,提示是QQ登录超时,70001。在网上找了很多解决办法但都没有用。后来问了学校一位电院同学,立刻就解决了;下面是解决办法供大家参考:如果电脑接的是网线,出现登录超时70001情况,需要在网络控制中将ipv6关掉,具体教程网上有的。希望可以帮到大家。转自:关于QQ登录超时70001问题的解决办法。 - 知乎...

2021-09-16 15:44:46 1657

转载 如何凝练具体的关键科学问题?

关于如何凝练具体的关键科学问题,我相信做过科研的同学大多都思考过这个问题,但很多人也许跟我一样,对这个问题一知半解。因此,分享一篇秦四清老师的博文,抛砖引玉,给大家关于科学问题凝练的一些思考。以下内容转自:http://wap.sciencenet.cn/blog-575926-1131989.html?mobile=1今年国基放榜后,有些未“中标”的申请人对评审意见“不服”,把本子和意见发给我看看问题出在哪。诚然,未“中标”的具体原因很多,在此不做详谈,仅聊聊涉及到的共性问题,即“关键科学问题”。

2021-08-26 11:50:05 2998

转载 IDLE常用快捷键(批量注释)

转自:https://www.cnblogs.com/liyuanhong/articles/4375890.html

2021-07-01 15:12:20 4245

原创 ValueError: check_hostname requires server_hostname的解决办法记录

在用pip安装numpy库时报错:ValueError: check_hostname requires server_hostname,如下图:在网上查了资料后,发现是VPN的问题,也就是说:把VPN关掉,就可以啦!之后就可以顺利安装了!

2021-07-01 10:30:04 4908 22

原创 如何在代码托管平台上学习知识

Github 作为全球最大的代码托管平台和开源社区,它的服务器在国外,所以一直存在访问速度过慢、甚至有时候无法访问的问题,非常让人头疼!!!慢有时候还可以忍受,但是对于最近几天发生的大片地区无法正常访问 Github 的问题,就必须有一个好的方法去解决了。使用 Gitee 的镜像仓库大家都知道国内正在积极推动开源社区的发展,其中 Gitee 就是我们国家支持推动的国内开源生态系统,经过这么多年的发展,大部分实用的仓库都可以在 Gitee 上找到镜像,而且由于其服务器是在国内,所以访问速度非常快速!!

2021-06-30 19:26:36 103

原创 记录下与控制相关的一些问题

滚动时域控制(或者叫滚动时域优化),英文为receding horizon control(RHC),又称为模型预测控制(Model Predictive Control,MPC),能有效解决多优化目标及约束问题,并能弥补模型失配、时变、干扰等引起的不确定性。 总结:RHC和MPC说的是一种方法!!!...

2021-06-23 15:15:52 603 1

原创 关于P、NP、NPC、NP-Hard问题的一点理解

相信经常看论文的科研人,对NP-Hard这个词都不陌生,特别是计算机专业的小伙伴。每次见都感觉对NP-Hard不太熟,认识有点模糊,于是花时间查了下资料,记录下一点认识。

2021-06-09 16:42:17 679

原创 论文阅读:《Cooperative Robots to Observe Moving Targets: Review》

本文主要是对多机器人跟踪移动目标这个问题的细化研究,即针对多机器人观察多移动目标展开综述。文章主要对多机器人观察多移动目标问题涉及的五个关键因素做了描述,同时也对解决这个问题的四种技术给予了解释。具体内容我就不多说了,给出文章的一个结构图。Ps:个人观点,文中的CT、CMOMMT、CSAT、MPE应该是4种不同的任务形式,而不是4种控制技术,这里表述存在问题文章来自:Khan A, Rinner B, Cavallaro A. Cooperative robots to observe movi

2021-06-08 15:19:05 124

原创 线性代数中的符号记录

最近看论文时,遇到了这个符号,不认识,如下:就是这个长得奇怪的R,而且它的右上角还带有数字,查了下资料,做个记录(公式符号不好打,直接贴图):上图核心意思就是:R代表的是实数集。那么据此推断一下,右上角带数字的R应该是矩阵,确切来说是所有实数矩阵的集合,如下:参考资料:1.https://zhuanlan.zhihu.com/p/3361368332.https://zh.wikipedia.org/wiki/%E5%AE%9E%E6%95%B0...

2021-05-27 14:54:17 3434

原创 似然与最大似然估计

http://fangs.in/post/thinkstats/likelihood/ https://zhuanlan.zhihu.com/p/26614750 https://blog.csdn.net/qq_36396104/article/details/78171600?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-2.contro

2021-05-27 10:33:14 69

转载 克拉美-罗下界(Cramer-Rao Lower Bound,CRLB)

克拉美-罗界。又称Cramer-Rao lower bounds(CRLB),克拉美-罗下界。克拉美罗界是对于参数估计问题提出的,为任何无偏估计量的方差确定了一个下限。无偏估计量的方差只能无限制的逼近CRB,而不会低于CRB,因此这个界也可以称为CRLB,意为克拉美罗下界。CRLB可以用于计算无偏估计中能够获得的最佳估计精度,因此经常用于计算理论能达到的最佳估计精度,和评估参数估计方法的性能(是否接近CRLB下界)。克拉美罗界本身不关心具体的估计方式,只是去反映:利用已有信息所能估计参数的最好效

2021-05-25 10:35:17 10279

原创 无偏性、有效性

无偏性定义式: 也即:估计量的数学期望等于被估计参数的真实值,则称此此估计量为被估计参数的无偏估计,即具有无偏性,是一种用于评价估计量优良性的准则。通俗说,就是只要你对估计量求完了期望,这个期望值等于被估计参数的值,它就是个无偏估计量。注意,就是单纯的数学推导,推导出来上面那个定义式,那这个估计量就是无偏估计量。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值,也即没有系统误差。有效性比较估计量的方差,方差越小越有效。一致性(相合性)随着样...

2021-05-24 21:12:02 6250

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除