自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 如何在Pytorch中对Tensor进行shuffle

今天在训练网络的时候,考虑做一个实验需要将pytorch里面的某个Tensor沿着特征维度进行shuffle,之前考虑的是直接使用shuffle函数(random.shuffle),但是发现random.shuffle函数会导致Tensor里面数据被重复提取,进而导致输出跟输入分布发生变化。a = torch.randint(0, 2, (3, 3))print(a)random.shuffle(a)print(a)因此,经过查找资料后,总结pytorch的tensor可以利用如下.

2021-04-27 17:43:52 12120 1

原创 Denoising Prior Driven Deep Neural Network for Image Restoration阅读笔记

Denoising Prior Driven Deep Neural Network for Image Restoration为Weisheng Dong在2018年TPAMI上发表的一篇关于先验驱动的图像复原网络。这篇文章不仅仅设计了融合先验知识的图像复原网络,也在前面introduction部分和related work部分针对已有的图像复原网络进行了综述。Motivation现有的大多数基于深度学习的图像复原算法仅仅是利用深度网络直接学习一个从低像质图像到高像质图像的映射,而传统方法中的观测特

2020-12-14 23:07:12 1234 4

原创 实时语义分割脉络梳理

作为计算机视觉中的一个经典的问题,语义分割已经受到了学界的广泛关注。语义分割是针对输入的图像的每个像素,预测出该像素属于何种类别。这种相对于目标检测提供边界框信息而言,能够产生更加稠密的预测,因此提供的信息也相对于目标框更为丰富,比如能够提供目标在图像中的准确边界信息等。因此,语义分割在自动驾驶等需要精细化信息的领域上有着非常大的应用前景,能够为计算机针对场景进行理解提供重要帮助。而随着Ale...

2020-04-03 20:55:56 5162 1

原创 Pytorch Loss 无法下降的问题

最近训练自己的Landmark检测网络的时候,遇到的loss无法下降的问题,现在记录如下,一方面给自己留个记录,另一方面希望能够给大家一些参考。主要就是使用的王井东老师团队的HRNet来跑我们自己做的数据集,不得不说HRNet的Pytorch训练流程对我们来说真的特别友好,有很多细节上的优化,一旦上手之后改很多东西都很方便。之前我已经在数据集上进行了验证,然后需要添加我们自己设计的模块,...

2020-01-03 09:53:55 18045 7

原创 Ubuntu中Scipy “can't import imread from scipy.misc”问题

最近由于服务器更新把显卡驱动搞崩了,所以这一个星期重新配了两次环境,其中最让我难受的就是scipy的问题了。先说结论:先安装numpy1.15+mkl,然后pillow,最后安装scipy1.0.0能够解决can't import imread的问题。调试过程:首先,我是按照代码报错顺序来的,在安装pytorch的时候,numpy已经自动安装了一遍,后来直接看到scipy报...

2019-06-28 16:19:39 495

原创 Panoptic Segmentation 论文阅读笔记与感想

Panoptic SegmentationAlexander Kirillov, Kaiming He, Ross Girshick, Carsten Rother, Piotr Dollár论文地址作者介绍于2018年1月3日提交至arXiv,最新一次arXiv提交为2019年4月10日。第一作者毕业于德国海德堡大学。Introduction什么是thin...

2019-06-18 15:26:12 916

原创 CUDA ERROR: device-side assert triggered at 问题及解决思路

cuda errorRuntimeError: cuda runtime error (59) : device-side assert triggered at ...我之前还以为是因为GPU抽风了引发的BUG,所以第一次没有在意,直接又重新开始运行了一次,但是第二次就发现程序在同样的地方断掉了,这也就想起来我以前看到的一个博客,里面有句话的大概意思是这样的:每次都在同样的地方出错的...

2019-05-29 15:20:50 100053 29

原创 关于python读取RGB图像的问题

记录一下我在使用python中的scipy.misc中的imread的问题。调用函数为from scipy.misc import imreadimage_path = './testimg.jpg'img = imread(image_path, mode = 'RGB')原图是:之后直接用RGB的方式保存出来的图像其实是:一开始还以为是我哪里的代码出...

2019-05-05 22:33:24 6314

原创 关于cv.cvtColor转换的问题及解决方法

问题描述篇:今天在调试困扰了我很久的一个问题,在训练网络生成batch数据的时候读入原始图像,输出的时候却老是出问题。我们都知道YUV和RGB之间的转换关系:R = Y + 1.4075 * V;G = Y - 0.3455 * U - 0.7169*V;B = Y + 1.779 * U;Y = 0.299 * R + 0.587 * G + 0.114 * ...

2019-05-05 22:13:12 5137 4

原创 2019.04.22-2019.04.28论文阅读笔记

2017_CVPR_Zhu_Semantic Amodal Segmentation由FaceAI公司提出的一个新的任务(和数据集),侧重在任务的提出和数据的标注工作。至于为什么会看到这篇文章,因为Kaiming He在2018 arXiv的Panoptic Segmentation中引用了这篇文章,目前本文引用量为20。Motivation:人在进行场景感知和理解的时候,如果碰到...

2019-04-28 10:15:23 1720

原创 2019.04.15-2019.04.21文献阅读笔记

泛读文献:1989_NC_LeCun_Backpropagation applied to handwritten zip code recognition经典文章,第一次将反向传播算法应用于神经网络上。核心设计思路在于:尽可能减少free number的数量,而无需过多减少计算量。另外,文章提出直接用归一化后的图片输入给网络,而不是将提取过特征的图片输入,证明了反向传播能够处理大量lo...

2019-04-22 09:21:50 317

原创 UPSNet A Unified Panoptic Segmentation Network - 2019 CVPR 阅读笔记

2019.04.08-2019.04.14论文阅读笔记精读文献:2019_CVPR_Xiong_UPSNet A Unified Panoptic Segmentation Network PSPNet一作赵恒爽合作的一篇2019年CVPR文章,做全景分割的。Introduction:提出了Unified Panoptic Segmentation Network(U...

2019-04-18 23:03:34 1219 9

原创 VALSE 4月12日 下午 第一会场 深度学习模型设计 会议记录

4月12日 下午 第一会场 深度学习模型设计主持人:王乃岩——图森未来题目:Deep High-Resolution Representation Learning for Visual Recognition讲者:王井东——微软亚研Convolutional Neural Network = Representation Learning低分辨率表征学习 → 图像...

2019-04-16 22:03:55 445

原创 VALSE 2019 4月12日  上午  第二会场 迁移学习与领域自适应 会议记录

4月12日 上午 第二会场 迁移学习与领域自适应主持人:杜博——武汉大学题目:Unsupervised and Weakly-supervised Domain Adaptation for Semantic Segmentation讲者:段立新——电子科技大学GoalTo apply existing domain knowledge to the learnin...

2019-04-16 21:51:55 636

原创 VALSE 2019 4月11日 晚 第五会场 弱监督视觉理解 会议记录

4月11日 晚 第五会场 弱监督视觉理解主持人:王兴刚——华中科技大学弱监督分为三类(三个等级):不完备:一部分标签已经存在,但是仍有一部分数据不存在标签;或者是在多任务学习中,某些数据有某些标签,另一些数据有另外一类标签,两种标签都存在的数据非常少;不准确:存在噪声(比如在网上收集数据作为网络训练数据时),不确切:比如在cityscape中,存在一部分非常粗糙的标签(2...

2019-04-16 15:56:57 757

原创 Bootstrapping the Performance of Webly Supervised Semantic Segmentation 论文笔记

由于在阅读该文章的时候遇到了很多问题,一开始也看不懂,想找博客看看别人理解的时候由于文章比较新,没有一篇博客是关于这篇文章的,所以现在自己写一篇吧(还是第一篇)。有问题希望大家能够帮忙指正。论文地址:http://openaccess.thecvf.com/content_cvpr_2018/CameraReady/1401.pdf一、介绍       本文为2018CVPR的一篇文章,主要是为了...

2018-07-11 17:36:54 1247

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除