自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

水不在深有江的博客

原创论文笔记:YOLOv4

说起来难受，自己的东西一直拖到YOLOv4出来了，唉。作者在related work中做了个综述，包括：1.网络模型； 2.不增加前传时间但提点的tricks(bag of freebies)； 3.略微增加前传时间但提点较大的tricks(bag of specials)。因为是综述这里就不一一罗列了。有一点值得一提的就是在进行网络模型分类的时候作者把一阶段网络称为"dense prediction",二阶段网络称为"sparse prediction"。这种说法比较少见但想想确实也合理。因为一阶段.

2020-05-09 16:24:35 1933

原创论文笔记:Non-local U-Nets for Biomedical Image Segmentation

因为是一篇医疗图像的论文所以看看大概做成什么样子，中了AAAI2020U-Net与自然图像不同，在医疗图像上U-Net被应用地较为广泛，具体原因可以参考知乎这篇回答。网络结构之前讨论过了，如下：motivation2个limitations：1. 卷积和下采样操作都是local的，只能提取局部信息。长距离信息需要通过大量堆叠卷积和下采样操作得到。因为feature map的数量会...

2020-04-18 17:05:01 841 2

原创论文笔记:SaccadeNet: A Fast and Accurate Object Detector

作者称，人眼通过扫描informative parts来理解目标定位(也是很常见的说法了)。这样的眼睛快速扫描称为Saccade。以"快”为优势，超越了YOLO和RetinaNet。由于abstract里直接提到了创新点四个模块the Center Attentive Module, the Corner Attentive Module, the Attention Transitive ...

2020-04-11 16:30:40 1889

原创论文笔记：1st Place Solutions for OpenImage2019 - Object Detection and Instance Segmentation

一篇比较新的文章，看简介就吸引了我：其中提到的核心思想与唐师兄说的非常相似。描述method的关键词也如此。题目倒是非常怪异，可能是为了吸引眼球吧。思想主要是目标检测中classification和regression的解耦。motivation和IOU-Net一样，问题在于：classification head 和regression head共享一样的parameters(这里可能是...

2020-04-02 15:10:41 1106

原创论文笔记：IRNet: Instance Relation Network for Overlapping Cervical Cell Segmentation

刘老师推荐的论文，与cervical cancer相关，也适当地看一下别人的做法。背景和宫颈癌相关，作者从细胞间重叠多，其他混杂的物体(非需要被检测的类)入手。method为了增强candidate selection 和 semantic consistency ，作者使用了Duplicate Removal Module (DRM) and Instance Relation Mo...

2020-03-27 15:56:47 903

原创论文笔记:Soft Anchor-Point Object Detection

作者针对两个问题：1.如何使anchor-free模型head性能更好？2.如何更好地利用特征金字塔？作者证明了，不高效的训练是造成anchor-point detector无法成为最优的主要原因。分别给出了原因：注意力偏差和特征选择。最后给出方案：soft-weighted anchor points and soft-selected pyramid levels其中，注意力偏...

2020-03-14 15:52:57 690

原创论文笔记：Overlap Sampler for Region-Based Object Detection

摘要中指出，现在的采样方法只着眼于样本与GT之间的IOU，而忽视了正负样本之间的IOU。如此会导致一些低质量的预测。motivation对于这种情况，作者称那些与正样本有较高IOU的负样本会在NMS过程中错误地抑制正样本。作者在文中将样本选取分为两类:loss-based和IOU-based。然而在loss-based处引用了focal loss和OHEM。感觉这里有失偏颇。正负样本的选...

2020-03-07 17:26:17 555

原创论文笔记：Cross-dataset Training for Class Increasing Object Detection

顾名思义，即跨数据集检测。作者称，对于跨数据集检测，直接将label混合会带来两个问题：1.目标的重复2.正负样本的冲突(如下图，人的GT box中很大一部分被作为是脸的负样本)不是很理解第二个问题说明的用意。作为不同的类别，正负样本的区域不一样不是很正常的事情吗？就算在单个数据集中也会大量出现。因此作者定出跨数据集训练策略：1.merge duplicated labels a...

2020-02-28 10:25:29 1927 1

原创论文笔记：Learning from Noisy Anchors for One-stage Object Detection

motivation作者指出，有些GT bbox存在包含其他物体，遮挡等现象。同时在训练时以IOU为标准划分的部分负样本也有可能包含重要的语义或者位置信息。因此训练时标签是noisy的。进而提出cleanliness scores作为一个re-weight因子在训练中对anchor进行调整。methodcleanliness scores定义如下：loc_a表示定位confidenc...

2020-02-22 11:56:30 2851 2

原创论文笔记：Side-Aware Boundary Localization for More Precise Object Detection

作者指出，在"there exists displacements with large variance between the anchors and the targets"(即anchor与目标之间存在大量位置偏移时)，传统的中心和size预测并不能很好地解决问题。因此引入side-aware预测。然而在motivation中，对于方法的提出，作者却给出了几乎没有说服力的解释：Emp...

2020-02-15 18:06:48 1223 1

原创论文笔记：Bounding Box Regression with Uncertainty for Accurate Object Detection

motivation在数据集方面：目标检测中，会出现bounding box表示模糊的情况。比如标注不准确(a,c)，遮挡(b)，边界不清或无法给出确切边界(d)：在损失在设计方面：作者指出，boundingbox 回归损失设计(如smooth L1 loss等)中，并没有对这种情况进行处理。同时，会认为分类置信度高的框更加精准，因此会出现下图高分反而不准的情况：(这一点问题和IOU...

2019-05-30 15:49:23 1675

原创论文笔记：GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

翻译过来就是“解剖GAN”。本文主要对GAN生成图像过程进行了可视化，提供了理论支撑和可解释性。motivation作者称，在论文《Network dissection:Quantifying interpretability of deep visual representations》提出，分类网络中，当units(一个unit指一张特征图(channel=1))被上采样并阈值化之后可...

2019-05-05 09:58:34 3025

原创论文笔记：Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convol

论文地址：https://export.arxiv.org/abs/1904.05049这是一篇最近新出的论文，引起了非常广泛的关注。比较期待后续代码的公布。题目即文章的主要思想，表达很明确：对传统的convolution进行改进，以降低空间冗余。其中“Drop an Octave”指降低八个音阶，代表频率减半。motivation文章首先指出，在自然图像中，图片分为低频部分和高频部分...

2019-04-18 20:20:24 3601 1

原创论文笔记：GIoU

论文标题：Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression收录于CVPR 2019因为整体思想形式比较简单，因此笔记不做赘述。整体来说本文提出了一个通用的trick，即用GIoU来替换bounding box回归损失函数，而GIoU可看作是对于IoU指标的一个改进。在...

2019-03-09 21:38:57 12330 2

原创论文笔记:Bag of Freebies for Training Object Detection Neural Networks

这篇论文看起来像是一种总结类文章，文中并没有提出新的结构模型之类，但是对于以前的一些做法进行了整合并应用于baseline中。也就是文中一再强调的“Bag of Freebies”，即在不改变模型结构并且不改变损失函数的情况下，不牺牲前向传播时间，将mAP提升近五个点。论文主要贡献如下：首次系统地评估了不同目标检测流程中应用的多种训练启发式方法，为未来的研究提供了有价值的实践指导。提出...

2019-02-23 10:25:25 5619

原创论文笔记:End-to-End Adversarial Retinal Image Synthesis

这是一篇应用创新型文章，因此仅作较为精简的笔记。本文使用GAN进行视网膜眼底图像合成，并将其应用于视网膜血管图分割模型的训练。在本文之前，也有人使用过GAN进行视网膜眼底图像合成，缺点是：由于采用(视网膜血管网络,视网膜眼底图像)成对训练，且视网膜血管网络又由真实视网膜图像经过另一个分割网络得到，所以一旦原始图像失焦，视网膜血管网络就会不完整，进而影响图像合成本文提出的方法不再依赖于这...

2019-01-25 16:41:47 1176 1

原创论文理解：A-Fast-RCNN

motivation：文中指出，由于偶然因素的存在，目标检测中目标的遮蔽情况，形状等并不完全符合寻常的分布(举例如下图)而为了使得网络模型对这些目标的变体具有鲁棒性，通常的做法是采用扩充数据集的方式来尽可能覆盖所有情况。而由于long-tail(长尾; 代表小批量销售的大量商品的市场部分，与大批量销售的少量商品相比，被认为具有更高的金融价值)的数据分布，这种方式很难涵盖所有情况，因此引入图片生...

2019-01-09 22:09:31 520 2

原创论文理解：Defense-GAN

由于首次接触对抗训练方面的内容,在此先对对抗训练相关知识做一个简要的整理。对抗训练基本说明见https://www.leiphone.com/news/201702/Jpb0uiOt9RTwcB8E.html对抗攻击大致分为3种...

2018-12-10 10:10:13 4163 6

原创论文笔记：InfoGAN

InfoGAN发于NIPS2016，也就是GAN诞生的两年之内。InfoGAN解决了一个可能所有刚接触GAN的人都会想到的问题：如何控制生成数据的语义特征？文中提出，原始GAN网络以不受任何限制的噪声Z作为输入，因而生成器只能以一种高度混乱的方式使用噪声，导致噪声Z中独立的维度与数据的语义特征不对应。文中提出了解决方案，即分解输入噪声为两个部分。其中，Z作为不可压缩的噪声源，c作为潜在的c...

2018-11-19 09:54:37 635

原创 Cycle GAN 论文解析

本文中，作者认为在图片转换中，desired output可能代价高昂(例如艺术作品)或者难以被很好的定义(例如下图斑马与马的转换)，因此提出了一个能在匹配的训练样本缺失的情况下，完成捕获一类图片集合特殊特征并将其转化进入另一类图片集合中的方法。可以将其广义地解释为图像转换，例如灰白图像变彩色，图片转化为语义标签，描边图转化为照片等等。附上开头的效果图：以及作者对匹配和不匹配的解释：...

2018-11-01 21:41:24 13080 1

原创 GAN论文笔记

作者指出，深度学习的目的旨在建立能够表示人造的具体应用中的数据分布的模型。为了避免极大似然估计和相关策略中的可能性计算逼近问题，提出GAN：由生成模型和判别模型组成，其中生成模型负责伪造数据，而判别模型负责检测样本服从模型分布还是原始数据分布。本文主要研究生成模型通过多层感知器传输随机噪声来生成样本，判别模型也是多层感知器的情况。Adversarial nets为了学习生成器在数据x上...

2018-10-26 09:25:06 434

原创 focal loss论文笔记

作者提出，训练集中的类别不平衡是阻碍一阶段检测器达到与二阶段检测器相同效果的主要原因（因为在二阶段检测中，在前景和背景数量上通过启发式采样例如固定前景背景比例，online hard mining部分解决了这一问题），因此提出一个新的loss函数。相反在一阶段中，尽管启发式采样也被应用，但是训练过程仍然被易被分类的背景examples所主导。这一问题可以通过bootstrapping或者har...

2018-10-13 19:27:12 795

原创 RFBnet论文笔记

作者认为，当前二阶段网络获得较好的准确率，然而因为特征来源于更深层的网络的庞大计算成本，所以速度较慢；一阶段网络为了加速检测而没有使用目标候选区域过程，因而牺牲了准确率，对于获得了可以与顶尖的二阶段网络准确率媲美的DSSD和RetinaNet，它们的表现提升来源于限制了效率的极深网络ResNet-101。因此提出，建立一个快且强力的检测器，应该对轻量级网络加上人为设计的部分而不是顽固地加深模型...

2018-10-02 10:50:24 6080

原创论文理解：YOLOv3

YOLOv3是在YOLOv2基础之上的提升，本论文主要包含以下几个方面：1.对YOLOv3的改进；2.改进的效果；3.一些“didn't work”的处理；4.这些改进的意义。the dealbounding box prediction延续YOLOv2的做法，仍使用dimension cluster来生成anchor box作为prior，网络仍输出X进行坐标预测，左上角偏移量(),...

2018-09-10 15:21:54 1054

转载关于ap，mAP的理解和计算

转载自https://blog.csdn.net/zdh2010xyz/article/details/54293298https://blog.csdn.net/hysteric314/article/details/54093734

2018-09-07 14:56:10 6858

原创论文笔记：IOUnet

作者指出，目前主流的目标检测网络都由两步完成：目标分类和目标定位。首先从背景中找出前景的object proposal并将其分配上合适的分类标签，然后通过最大化IOU或者其他检测结果和ground truth之间的度量标准来进行对定位目标的系数回归。最后多余的bounding box会通过NMS去除。分类和定位在这样的检测流水线上被不同的处理，每种分类标签是proposal的“classifi...

2018-08-24 09:14:57 10127 17

原创论文笔记：YOLOv2

作者认为，目标检测框架变得愈发快速和准确，然而都局限于一个小的目标集。而与分类和标记等其他任务的数据集相比，当前目标检测数据集显得相对有限。因此，想要检测可以与目标分类的级别规模相当，而提出了一种新方法来利用已经拥有的大量分类数据，并使用它来扩大当前检测系统的范围。该方法使用目标分类的层次视图，允许不同的数据集合在一起。同时提出联合训练算法，可以在检测数据和分类数据上训练目标检测器。通过这种方...

2018-08-16 20:33:03 435

原创论文笔记：YOLOv1

针对当前目标检测速度慢而无法做到实时检测的问题，作者提出了YOLO。YOLO直接将目标检测转化到回归问题上，直接用一张图片得到bounding box和类别。作者提出YOLO的优点：1、YOLO检测物体非常快。因为没有复杂的检测流程，只需要将图像输入到神经网络就可以得到检测结果，YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更...

2018-08-15 16:59:18 344

原创论文笔记：FPN

对于尺寸相差较大的目标的识别，一直是计算机视觉中的一个重大挑战。特征金字塔基于图像金字塔建立，特征金字塔具有尺度不变性因为物体的大小可以通过改变在金字塔中的层数来实现。这项性能使得一个模型通过在金字塔中扫描位置和层数来见测尺度规模跨度较大的一系列物体。作者提出，将图像金字塔每一层特征化的主要优势在于可以产生一个所有层（包括高分辨率层）具有强语意信息的多尺度特征表示。将图像金字塔每一层特征化...

2018-08-11 11:13:10 512

转载图像卷积与滤波的一些知识点

看到一篇不错的文章 https://blog.csdn.net/zouxy09/article/details/49080029 手上有事以后再看其中博主将水平垂直滤波器和垂直的弄反了。。。

2018-08-09 16:32:31 157

原创论文笔记：Faster-RCNN

多篇论文已提出使用深层网络来定位专门类别或者未知类别的bounding box。在OverFeat中，利用全连接层来预测单个物体定位任务的box坐标。这一全连接层随后发展为检测多重特定类别物体的卷积层。Multibox方法中，从一个最后一层为用于R-CNN目标检测的全连接层，同时预测多种box的网络中生成region proposal。卷积的计算共享也引人注意。OverFeat从图像金字塔中计...

2018-08-07 22:05:45 272

原创论文理解：SSD

作者认为，当前的目标检测系统虽然准确，但是对于嵌入式系统甚至高端硬件来说仍需要大量集中的计算，对于即时应用仍然太慢了。于是在本文中提出了SSD（Single Shot MultiBox Detector）。SSD架构如下：如图（a）SSD在训练期间仅需要每个对象的输入图像和对应的ground truth box(真实标签框)。卷积处理时，我们在具有不同尺度（例如（b）和（c）中的8×8...

2018-08-06 15:59:48 1192

原创 GoogleNetv1，ResNet，DenseNet总结

首先引出看别人笔记时发现的一张图：这张图可能有点老了，没有加上后来的DenseNet。从时间线上来说，先有GoogleNet，再有ResNet，然后有DenseNet。自AlexNet提出以来，主流网络结构突破主要在于网络更深（层数多），更宽（神经元）。GoogleNet的提出，主要着力于在增加网络深度宽度的同时减少参数。inception块结构图如下：传统的卷积神...

2018-08-06 08:55:01 2077

转载论文理解：GoogleNetv1

根据师兄的建议看了GoogleNet论文。可能由于理论知识欠缺，这篇论文看得云里雾里，虽说在吴恩达的deeplearning课程中学习过，但是论文中还是有不少不懂的地方，只能借助其他人的笔记学习。 GoogleNet是深度为22层的，利用inception结构的网络。Inception结构很好地利用了网络中的计算资源，并且在不增加计算负载的情况下，增加网络的宽度和深度。同时，为了优化网络质...

2018-08-01 18:43:20 465

转载关于Global average Pooling

看了几个典型网络似乎最后都有这一层Global average Pooling，相关说明转载自https://blog.csdn.net/williamyi96/article/details/77530995https://blog.csdn.net/losteng/article/details/51520555...

2018-07-31 16:36:44 812

转载 tf.concat()用法

在看densenet代码是看到，查了一下发现可能由于版本问题出现了变动导致有些说法有问题，这里有正确的转载自https://blog.csdn.net/qwe2508/article/details/78093776...

2018-07-31 16:17:21 1864

原创 deeplearning课程学习报告（4）

卷积神经网络week3笔记https://blog.csdn.net/stezio/article/details/81152416关于xavier初始化的一些解释https://blog.csdn.net/stezio/article/details/81162315卷积神经网络week4笔记https://blog.csdn.net/stezio/article/details/811...

2018-07-29 19:18:56 195

原创论文理解：DenseNet

根据师兄的建议看了DenseNet论文。还有其他人的一些笔记https://blog.csdn.net/malele4th/article/details/79429028https://blog.csdn.net/u014380165/article/details/75142664 DenseNet仍然是针对出现的新问题：输入或者梯度信息穿过多层网络后，会在到达网络的结尾（对于...

2018-07-28 09:36:31 1464

原创论文理解：ResNet

根据师兄的建议看了resnet论文，又看了一些论文笔记：https://blog.csdn.net/xxy0118/article/details/78324256https://blog.csdn.net/lanran2/article/details/79057994对应之前deeplearning课程完成过的代码再次梳理一遍吧。。。论文中针对“退化”问题，即随着网络深度增加，...

2018-07-27 15:52:16 742

转载为什么误差采取平方和形式

转载自https://www.cnblogs.com/diegodu/p/5725139.html

2018-07-25 10:03:13 2654

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

龙骑士尹志华 CSDN认证博客专家 CSDN认证企业博客

码龄7年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

44: 原创

10万+: 周排名

168万+: 总排名

10万+: 访问

: 等级

1385: 积分

33: 粉丝

32: 获赞

36: 评论

229: 收藏

私信

关注

热门文章

最新评论

论文理解：Defense-GAN
我那么厉害: 这里我也不明白，请问大佬了解了吗
论文笔记：Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convol
ITLCFgoing: 对于特征图他是怎么区别哪些是低频和哪些是高频的呢
Cycle GAN 论文解析
我不是仙女姐姐: 请问需要设置几个epoch才能看得出效果呢
论文笔记：Cross-dataset Training for Class Increasing Object Detection
Luna_Lovegood_001: 具体到实际的计算过程，对于minibatch中任意一张图片，只计算属于该数据集类别的损失。即新模型有(a+b)类，只抽出a类计算类别损失，其余不动。您您好，其实retinanet 中有一个二分类，判断前景和背景的。感觉没有办法进行细粒度判断。
论文笔记：Learning from Noisy Anchors for One-stage Object Detection
weixin_49756668: 请问这个代码开源了吗

最新文章

提示

确定要删除当前文章？

取消删除