偷摸学习的山哥-CSDN博客

原创 Windows C++ yolov5-＞ONNX-＞TensoRT （ResNet、FCN）

这个博客是以yolov5为例的，但是这一套流程我是用ResNet分类、FCN分割和yolo检测都是能走通的，更重要的方法掌握。

2022-05-04 10:16:48 2885 3

原创 VS没有Debug或者Release选项

C++和IDE都不熟悉，搞了一整天。以没有Debug为例，首先可以在配置管理这里添加一个Debug然后，打开项目管理器->链接器->调试->生成调试信息改一下。

2022-04-12 14:09:23 3108

原创 torchvision resnet使用groups分组卷积后参数量变大

例如设置model=resnet50（groups=2）参数量是groups=1时接近两倍原因：在定义中有width代表了基准的通道数默认为64，即第一个CONV后的C为64.这里的groups设置并不是常规的分组卷积的groups，而是将基准的通道数扩张了groups倍。更改的话直接把*groups删掉就好了。...

2022-04-02 20:02:23 523 1

原创取出tensor的梯度

自己在用的时候，直接使用a.grad报错。正确的方法：https://zhuanlan.zhihu.com/p/168443176

2022-01-29 16:25:06 1623

原创 Gumbel-Softmax(离散采样如何进行反向传播)

https://zhuanlan.zhihu.com/p/166632315

2021-12-17 17:04:43 578

原创语义分割混淆矩阵 miou计算

https://blog.csdn.net/sinat_29047129/article/details/103642140

2021-11-05 11:11:27 721

原创 align_corners torch上采样

https://zhuanlan.zhihu.com/p/87572724?from_voters_page=true其中：align_corners=True 配合 8x+1 的尺寸，可以相对于 aling_corners=False 配合 8x 的尺寸，减少内插的数目，并且避免外插。

2021-10-18 15:05:15 146

原创 Wasserstein GAN

https://zhuanlan.zhihu.com/p/25071913

2021-09-18 17:05:58 74

原创 torch 将图像分成patch

img 原始shape=（3，256，256）img = img.view（3，4，64，4，64）img = img.permute(1,3,0,2,4)此时img[i][j] 0<=i<4,0<=j<4代表每一个patch

2021-09-15 16:28:17 3211 1

原创 VQ VAE

https://zhuanlan.zhihu.com/p/91434658

2021-09-15 16:18:29 127

原创 cross modal综述视频！

https://www.bilibili.com/video/BV1Af4y1n7zx

2021-09-15 11:36:31 83

原创 First Order Motion Model for Image Animation

静态图像视频生成First Order Motion Model for Image Animationhttps://blog.csdn.net/h1063135843/article/details/107841651

2021-09-02 10:13:21 197

自监督经典论文MOCO在MOCO之前，对比学习的方式有两种。（a）需要两个encoder计算正样本q和负样本k，这依赖于大batchsize，并且需要两边梯度回传。（b）memory bank的方式，将所有负样本存在bank中，每次计算loss时只需要计算正样本q，不需要更新负样本。但是问题很明显，负样本的映射方式f(x)是一尘不变的，而正样本encoder是一直更新。这导致两边差距越来越大。MOCO提出了一种新的方式，原来数据结构也可以应用到深度学习。亮点如下：（1）MOCO是带有正样本和负

2021-07-05 10:08:48 1129

原创 visdrone2019

2021-04-30 08:56:23 866

原创 AEGAN

https://blog.csdn.net/g8015108/article/details/78041154

2021-04-25 19:02:02 465

原创反卷积尺寸的计算

https://blog.csdn.net/qq_27261889/article/details/86304061

2021-04-18 14:28:56 179

原创 pyttsx3 中文朗读问题

我的问题发生在TX2上，不能朗读中文在初始化engine后加一句engin.setproperty（’vioce’，‘zh）

2021-03-15 19:14:23 1469 3

原创 pyttsx3 libespeak.so.1: cannot open shared object file

sudo apt-get install espeak

2021-03-09 11:22:12 554

原创 conda 可用镜像源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

2021-02-17 17:53:23 1074

原创 pytorch获取中间层

https://www.zhihu.com/question/68384370使用hook的方法也在链接里直接在前向传播加一句就可以，在model.train（）后，直接调用就可以了

2021-02-17 11:08:01 183

原创 Output 0 of UnbindBackward is a view and is being modified inplace

出错原因，参考：https://blog.csdn.net/pearl8899/article/details/112185772。对于torch1.7，问题发生在utils.py，make_grid()函数中74行但是这个解决方法不适用torch utils.py，因为这个函数把range（）这个内置函数占用了。所以修改为： for i, t in enumerate(tensor): # loop over mini-batch dimension norm_ra

2021-02-16 17:22:21 2021 2

原创神奇的cyclegan！

什么是cyclegancyclegan在解决什么问题？在生成对抗网络中，有一个难点需要被关注。传统的GAN需要成对的数据训练，想要训练出一个结果，那么数据集必须要包含相对应的源域和目标域，如下图左侧：但是获取这些成对的数据是非常困难的，为了解决这个问题，cyclegan应运而生。现在我只有源于和目标域不成对的数据，如上图右侧，那么利用cyclegan也可以做到域的转换。原理整个cyclegan分三大模块对应三部分损失（代码是四部分，后续再说），生成器Gab由A域生成B域，生成Gba由B域生成A

2021-02-14 22:35:39 574

原创 Pyhton中extend（）方法去掉二维List中的一列或者一行的妙用

https://blog.csdn.net/qq_31672701/article/details/100574277?utm_term=python%E5%88%A0%E9%99%A4%E5%88%97%E8%A1%A8%E4%B8%AD%E7%9A%84%E4%B8%80%E5%88%97&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2allsobaiduweb~default-0-100574277&spm

2021-02-04 22:36:48 446

原创 TX2 安装pycharm

对于jetpack4.3以下按照这个链接：https://blog.csdn.net/zt1091574181/article/details/88899668对于jetpack4.4：将上述面链接中openjdk-8-jdk改为openjdk-11-jdk如果你不幸安装错误，那么需要删除jdk重新安装删除链接 https://www.cnblogs.com/xiaoliu66007/p/7591214.html...

2021-02-02 19:11:49 246 1

原创 YOLOV5模型架构

模型架构是按照配置文件yaml进行搭建的。不同的版本的yaml在model文件夹中，每一版本的模型分为两个部分backbone和head。每一行代表了一个运算单元，这里按照YOLOV5结构图可以方便理解。每一行有四个参数，参数1：代表输入从运算单元获得，-1代表从上一个单元获得。参数2：代表该运算单元的重复次数。在yolov5中，不同版本就是控制操作单元的重复次数改变的。参数3：该操作单元的名字。参数4：输入的参数。为了方便理解，说明yaml文件中CONV=下图的CBL，C3=下图的CSP。mo

2021-02-01 20:03:02 3448 1

原创 python中eval（）

eval(expression, globals=None, locals=None)eval相当于剥离出字符串引号中的运算，expression是输入的字符串，globals，locals是作用域，两个可以同时出现，优先级：local>lobal简单用法：https://blog.csdn.net/qq_29883591/article/details/53443062还有一种稍微复杂的方式：结果在定义了一个自函数后，将这个函数名字以字符串格式输入eval（），返回的结果就是一个实例化后

2021-02-01 18:54:49 189 1

原创解决报错 OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized

https://blog.csdn.net/weixin_41449637/article/details/108894809?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.

2021-01-30 10:59:14 2549

原创 ATSS

https://zhuanlan.zhihu.com/p/115407465

2021-01-27 12:50:46 68

原创 Qt如何在其他cpp文件中控制MainWindow的控件(小白专用！！)

https://blog.csdn.net/qq_37668436/article/details/104143075?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-6&spm=1001.2101.3001.4242

2021-01-11 15:49:39 946

原创 win10 64位 QT5配置opencv环境（亲测成功）

前面编译过程要看下这个视频https://www.bilibili.com/video/BV1Za4y1v7ra?from=search&seid=8853456064479114255up主讲的很清楚，版本最好对应。但是最后在QT运行还是会报错，error: cannot find -llibopencv_world420.dlld我的解决办法是：（更换自己的路径）首先找到3部分文件，静态库（.lib文件），动态库（.a文件）（VS的为.dll）,头文件。静态库文件位于通过CMAKE

2021-01-10 14:00:46 771 1

原创 python setup.py build develop编译出错 RuntimeError: Error compiling objects for extension

安装1.4pytorch 解决了

2021-01-05 10:42:40 7544

原创在python中将多张图片合成为视频

https://blog.csdn.net/choumin/article/details/90319477?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control

2020-12-23 11:51:34 365 1

原创 python读二进制文件并转类型

2020-12-21 21:13:54 490 1

原创 Every Pixel Matters: Center-aware Feature Alignment for Domain Adaptive Object Detector

早上起来想到可以用全卷积的方式生成实例级的特征，在进行迁移。到实验室就看到了这篇文章，好巧。注意！！文章里的FC代表的全卷积不是全连接首先作者认为，图像级和实例迁移背景和噪声太多，损失太大。而基于中心区域的迁移会减少这种误差。作者使用anchor-free的检测框架作为检测pipeline。首先一个G（CNN）提取特征后进行一个图像级的迁移，然后经过P（全卷积FC）生成两个特征图，类别无关Mctr和类别相关Mcls。Mctr就是anchor-free检测框架下中对中心点的预测，Mcls是对像素

2020-12-14 11:36:54 687 3

原创 DETR

End-to-End Object Detection with Transformers论文地址：https://arxiv.org/pdf/2005.12872.pdf前面部分比较好理解，CNN提取特征送入transformer，输出n个box prediction，n代表了模型可以检测出物体最大的数目，是人为设定的。其中box包括了（类别，坐标）如何拜托NMS这种后处理呢，就是应用了二分匹配的原理。让预测出来n个box匹配实际的K个box，此时的n和K可能是不对等的，这样在匹配时就限制了n个

2020-12-09 09:58:42 263

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Desktop.zip

空空如也