自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(117)
  • 资源 (1)
  • 收藏
  • 关注

原创 Windows C++ yolov5->ONNX->TensoRT (ResNet、FCN)

这个博客是以yolov5为例的 ,但是这一套流程我是用ResNet分类、FCN分割和yolo检测都是能走通的,更重要的方法掌握。

2022-05-04 10:16:48 2885 3

原创 VS没有Debug或者Release选项

C++和IDE都不熟悉,搞了一整天。以没有Debug为例,首先可以在配置管理这里添加一个Debug然后,打开项目管理器->链接器->调试->生成调试信息改一下。

2022-04-12 14:09:23 3108

原创 torchvision resnet使用groups分组卷积后参数量变大

例如设置model=resnet50(groups=2)参数量是groups=1时接近两倍原因:在定义中有width代表了基准的通道数默认为64,即第一个CONV后的C为64.这里的groups设置并不是常规的分组卷积的groups,而是将基准的通道数扩张了groups倍。更改的话直接把*groups删掉就好了。...

2022-04-02 20:02:23 523 1

原创 取出tensor的梯度

自己在用的时候,直接使用a.grad报错。正确的方法:https://zhuanlan.zhihu.com/p/168443176

2022-01-29 16:25:06 1623

原创 Gumbel-Softmax(离散采样如何进行反向传播)

https://zhuanlan.zhihu.com/p/166632315

2021-12-17 17:04:43 578

原创 语义分割 混淆矩阵 miou计算

https://blog.csdn.net/sinat_29047129/article/details/103642140

2021-11-05 11:11:27 721

原创 align_corners torch上采样

https://zhuanlan.zhihu.com/p/87572724?from_voters_page=true其中:align_corners=True 配合 8x+1 的尺寸,可以相对于 aling_corners=False 配合 8x 的尺寸,减少内插的数目,并且避免外插。

2021-10-18 15:05:15 146

原创 Wasserstein GAN

https://zhuanlan.zhihu.com/p/25071913

2021-09-18 17:05:58 74

原创 torch 将图像分成patch

img 原始shape=(3,256,256)img = img.view(3,4,64,4,64)img = img.permute(1,3,0,2,4)此时img[i][j] 0<=i<4,0<=j<4代表每一个patch

2021-09-15 16:28:17 3211 1

原创 VQ VAE

https://zhuanlan.zhihu.com/p/91434658

2021-09-15 16:18:29 127

原创 cross modal综述视频!

https://www.bilibili.com/video/BV1Af4y1n7zx

2021-09-15 11:36:31 83

原创 First Order Motion Model for Image Animation

静态图像视频生成First Order Motion Model for Image Animationhttps://blog.csdn.net/h1063135843/article/details/107841651

2021-09-02 10:13:21 197

原创 MOCO、SimCLR、MOCO2、BYOL

自监督经典论文MOCO在MOCO之前,对比学习的方式有两种。(a)需要两个encoder计算正样本q和负样本k,这依赖于大batchsize,并且需要两边梯度回传。(b)memory bank的方式,将所有负样本存在bank中,每次计算loss时只需要计算正样本q,不需要更新负样本。但是问题很明显,负样本的映射方式f(x)是一尘不变的,而正样本encoder是一直更新。这导致两边差距越来越大。MOCO提出了一种新的方式,原来数据结构也可以应用到深度学习。亮点如下:(1)MOCO是带有正样本和负

2021-07-05 10:08:48 1129

原创 visdrone2019

2021-04-30 08:56:23 866

原创 AEGAN

https://blog.csdn.net/g8015108/article/details/78041154

2021-04-25 19:02:02 465

原创 反卷积尺寸的计算

https://blog.csdn.net/qq_27261889/article/details/86304061

2021-04-18 14:28:56 179

原创 pyttsx3 中文朗读问题

我的问题发生在TX2上,不能朗读中文在初始化engine后加一句engin.setproperty(’vioce’,‘zh)

2021-03-15 19:14:23 1469 3

原创 pyttsx3 libespeak.so.1: cannot open shared object file

sudo apt-get install espeak

2021-03-09 11:22:12 554

原创 conda 可用镜像源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

2021-02-17 17:53:23 1074

原创 pytorch获取中间层

https://www.zhihu.com/question/68384370使用hook的方法也在链接里直接在前向传播加一句就可以,在model.train()后,直接调用就可以了

2021-02-17 11:08:01 183

原创 Output 0 of UnbindBackward is a view and is being modified inplace

出错原因,参考:https://blog.csdn.net/pearl8899/article/details/112185772。对于torch1.7,问题发生在utils.py,make_grid()函数中74行但是这个解决方法不适用torch utils.py,因为这个函数把range()这个内置函数占用了。所以修改为: for i, t in enumerate(tensor): # loop over mini-batch dimension norm_ra

2021-02-16 17:22:21 2021 2

原创 神奇的cyclegan!

什么是cyclegancyclegan在解决什么问题?在生成对抗网络中,有一个难点需要被关注。传统的GAN需要成对的数据训练,想要训练出一个结果,那么数据集必须要包含相对应的源域和目标域,如下图左侧:但是获取这些成对的数据是非常困难的,为了解决这个问题,cyclegan应运而生。现在我只有源于和目标域不成对的数据,如上图右侧,那么利用cyclegan也可以做到域的转换。原理整个cyclegan分三大模块对应三部分损失(代码是四部分,后续再说),生成器Gab由A域生成B域,生成Gba由B域生成A

2021-02-14 22:35:39 574

原创 Pyhton中extend()方法去掉二维List中的一列或者一行的妙用

https://blog.csdn.net/qq_31672701/article/details/100574277?utm_term=python%E5%88%A0%E9%99%A4%E5%88%97%E8%A1%A8%E4%B8%AD%E7%9A%84%E4%B8%80%E5%88%97&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2allsobaiduweb~default-0-100574277&spm

2021-02-04 22:36:48 446

原创 TX2 安装pycharm

对于jetpack4.3以下按照这个链接:https://blog.csdn.net/zt1091574181/article/details/88899668对于jetpack4.4:将上述面链接中openjdk-8-jdk改为openjdk-11-jdk如果你不幸安装错误,那么需要删除jdk重新安装删除链接 https://www.cnblogs.com/xiaoliu66007/p/7591214.html...

2021-02-02 19:11:49 246 1

原创 YOLOV5模型架构

模型架构是按照配置文件yaml进行搭建的。不同的版本的yaml在model文件夹中,每一版本的模型分为两个部分backbone和head。每一行代表了一个运算单元,这里按照YOLOV5结构图可以方便理解。每一行有四个参数,参数1:代表输入从运算单元获得,-1代表从上一个单元获得。参数2:代表该运算单元的重复次数。在yolov5中,不同版本就是控制操作单元的重复次数改变的。参数3:该操作单元的名字。参数4:输入的参数。为了方便理解,说明yaml文件中CONV=下图的CBL,C3=下图的CSP。mo

2021-02-01 20:03:02 3448 1

原创 python中eval()

eval(expression, globals=None, locals=None)eval相当于剥离出字符串引号中的运算,expression是输入的字符串,globals,locals是作用域,两个可以同时出现,优先级:local>lobal简单用法:https://blog.csdn.net/qq_29883591/article/details/53443062还有一种稍微复杂的方式:结果在定义了一个自函数后,将这个函数名字以字符串格式输入eval(),返回的结果就是一个实例化后

2021-02-01 18:54:49 189 1

原创 解决报错 OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized

https://blog.csdn.net/weixin_41449637/article/details/108894809?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.

2021-01-30 10:59:14 2549

原创 ATSS

https://zhuanlan.zhihu.com/p/115407465

2021-01-27 12:50:46 68

原创 Qt如何在其他cpp文件中控制MainWindow的控件(小白专用!!)

https://blog.csdn.net/qq_37668436/article/details/104143075?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-6&spm=1001.2101.3001.4242

2021-01-11 15:49:39 946

原创 win10 64位 QT5配置opencv环境(亲测成功)

前面编译过程要看下这个视频https://www.bilibili.com/video/BV1Za4y1v7ra?from=search&seid=8853456064479114255up主讲的很清楚,版本最好对应。但是最后在QT运行还是会报错,error: cannot find -llibopencv_world420.dlld我的解决办法是:(更换自己的路径)首先找到3部分文件,静态库(.lib文件),动态库(.a文件)(VS的为.dll),头文件。静态库文件位于通过CMAKE

2021-01-10 14:00:46 771 1

原创 python setup.py build develop编译出错 RuntimeError: Error compiling objects for extension

安装1.4pytorch 解决了

2021-01-05 10:42:40 7544

原创 在python中将多张图片合成为视频

https://blog.csdn.net/choumin/article/details/90319477?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control

2020-12-23 11:51:34 365 1

原创 python读二进制文件并转类型

2020-12-21 21:13:54 490 1

原创 Every Pixel Matters: Center-aware Feature Alignment for Domain Adaptive Object Detector

早上起来想到可以用全卷积的方式生成实例级的特征,在进行迁移。到实验室就看到了这篇文章,好巧。注意!!文章里的FC代表的全卷积不是全连接首先作者认为,图像级和实例迁移背景和噪声太多,损失太大。而基于中心区域的迁移会减少这种误差。作者使用anchor-free的检测框架作为检测pipeline。首先一个G(CNN)提取特征后进行一个图像级的迁移,然后经过P(全卷积FC)生成两个特征图,类别无关Mctr和类别相关Mcls。Mctr就是anchor-free检测框架下中对中心点的预测,Mcls是对像素

2020-12-14 11:36:54 687 3

原创 DETR

End-to-End Object Detection with Transformers论文地址:https://arxiv.org/pdf/2005.12872.pdf前面部分比较好理解,CNN提取特征送入transformer,输出n个box prediction,n代表了模型可以检测出物体最大的数目,是人为设定的。其中box包括了(类别,坐标)如何拜托NMS这种后处理呢,就是应用了二分匹配的原理。让预测出来n个box匹配实际的K个box,此时的n和K可能是不对等的,这样在匹配时就限制了n个

2020-12-09 09:58:42 263

原创 numpy保留小数位

no.around

2020-12-07 15:48:46 1459

原创 Consistency Regularization

原理很简单就是,当输入在很小变动情况下,网络的输出不应该存在变化。比如一个图像加了噪声前和加了噪声后对结果应该不产生影响。https://zhuanlan.zhihu.com/p/46893709

2020-11-27 18:29:04 682

原创 Adapting Object Detectors via Selective Cross-Domain Alignment

https://blog.csdn.net/qq_24548569/article/details/105017990

2020-11-27 13:45:31 108

原创 域自适应——Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent

以往的域适应方法中,只考虑的全局特征的对齐,会导致两个域的特征在某些情况出现负对齐。黄色箭头是源域数据在网络中的流向,蓝色是目标域。首先会经过权重共享层,输出两个像素级特征。为了保证这两个像素级特征是网络从不同的方向提取的,在这里引入了LOSS1:这个损失函数保证了两个输出是不同的。对于源域,特征1+特征2被当作网络的分割结果,这里有L2:还有一个域类判别器,它的输入是源域的特征1+特征2和目标域的特征1+特征2。对于目标域,需要维持两个特征的差值,作为局部对齐程度的依据,会产生一个loca.

2020-11-19 17:21:52 370

原创 RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.DoubleTensor) should be the

https://blog.csdn.net/jizhidexiaoming/article/details/82502280

2020-11-12 20:33:05 625

Desktop.zip

针对沙漠、草地和林地的三类常见地貌分类问题,本文提出了一种地貌分类算法。算法分为两个阶段。第一个阶段,基于梯度二值图像经过霍夫变换[1]检测所有竖直线的长短,建立林地地貌与沙漠和草地地貌的二分分类器,判断被测图像地貌类型是否为林地,很好的利用了林地地貌的梯度特征。第二个阶段,利用了草地和沙漠地貌颜色特征的差异,基于草地地貌和沙漠地貌图像的颜色矩建立二分类器,判断被测图像地貌类型是沙漠还是草地。

2020-06-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除