gbyy42299-CSDN博客

原创复现Deeply Supervised Salient Object Detection with Short Connections过程（附tensorflow+python代码）

趁着周末，把自己上周复现的paper CVPR 2017 “Deeply Supervised Salient Object Detection with Short Connections”写下来，以便以后加深影像。数据部分来自于项目的数据，所以并没有用论文中的原始数据测试和论文中的结果的差别。我会在文章结尾放出github地址，如果大家有兴趣，可以去跑一下论文里面的数据看看。主要是基于HED做...

2018-03-02 23:20:36 9885 40

转载 Large Margin Object Tracking with Circulant Feature Maps详解

这个文章作者在知乎又一个比较好的介绍：知乎链接概要疫情还未过去，趁着有空和项目需要来简单记录一下object tracking方面的文章吧。这篇paper创新点主要有三个：（1）结构化SVM：结构化SVM与传统SVM相比有着强大的判别力，而相关滤波有着速度上惊人的优势，作者将结构化SVM与相关滤波算法相结合；（2）跟踪错检问题：多峰前向检测。这一点是用来解决相似物体干扰的。在目标周围有特...

2020-02-11 12:45:58 1214 5

原创 KCF算法数学推导及算法流程图

参考文章：https://blog.csdn.net/shenxiaolu1984/article/details/50884830https://blog.csdn.net/discoverer100/article/details/53835507https://blog.csdn.net/discoverer100/article/details/54345209https://...

2020-01-15 08:08:52 5266 2

原创 Pytorch分布式训练指南（详细）

pytorch分布式训练指北作者：高彬 g00471741第一章节的部分是简单的科普，想看如何在本地跑pytorch分布式的直接看第二章。1、pytorch分布式代码基础1.1、如何写pytorch的分布式代码这个部分大概讲一下如何写分布式的Pytorch代码，首先，官方pytorch(v1.0.10)在分布式上给出的api有这么两个非常重要的，需要使用的：torch.nn....

2019-12-23 21:34:43 10359 2

原创手推机器学习算法系列 —核方法

2019-12-15 16:16:42 290

原创手推机器学习算法系列 —SVM约束优化问题

2019-12-15 14:32:48 248

原创手推机器学习算法系列 — soft-margin SVM

2019-12-14 19:55:11 179

原创目标检测出现loss为Nan的情况分析

背景在训练检测网络，比如faster rcnn等时，有时候会出现loss=Nan的情况，根据自己的调参经验总结一下。可能情况个人发现的可能情况如下几种：1、编译的时候gpu arch设置有问题，导致编译后的包有问题。在lib下的setup.py脚本中找到对应的地方，根据https://arnon.dk/matching-sm-architectures-arch-and-gencode-...

2019-12-13 13:48:40 2851

原创 An End-to-End Architecture for Class-Incremental Object Detection With Knowledge Distillation详解

背景最近在做目标检测增量学习相关的东西，所以看了这个CIOD的论文记录在这里，这里面有一些基础内容可以看我之前的两篇文章：https://blog.csdn.net/gbyy42299/article/details/83718533https://blog.csdn.net/gbyy42299/article/details/83616918伪代码...

2019-12-12 21:44:49 863 1

原创手推机器学习算法系列 — hard-margin SVM

参考：https://zhuanlan.zhihu.com/p/35755150

2019-12-11 20:53:34 255

转载 Faster RCNN全网最详细的解析

论文链接 Faster R-CNN Towards Real-Time Object，tensorflow源码链接https://zhuanlan.zhihu.com/p/32702387本文也会借助代码来一起讨论整个网络结构和训练过程。Faster R-CNN的基本结构：由以下4个部分构成：1、特征提取部分：vgg网络2、RPN部分：这部分是Faster R-CNN全新提出的结构，...

2019-09-12 19:37:49 1914

原创 CornerNet详解

一、网络结构先放一个网络的结构图以便理解：首先1个7×7的卷积层将输入图像尺寸缩小为原来的1/4（论文中输入图像大小是511×511，缩小后得到128×128大小的输出）。然后经过特征提取网络（backbone network）提取特征，该网络采用hourglass network，该网络通过串联多个hourglass module组成（Figure4中的hourglass network...

2019-05-06 11:15:36 3912 1

原创 CenterNet :Objects as Points阅读笔记（未完待续）

这个文章作者在构建模型时将目标作为一个点——即目标BBox的中心点。我们的检测器采用关键点估计来找到中心点，并回归到其他目标属性，例如尺寸，3D位置，方向，甚至姿态...

2019-05-02 18:40:59 989 1

原创 tensorflow一行一行实现SSD目标检测算法及全网做详细解读

参考了一些网上的SSD的实现，现在对其进行tensorflow的实现讲解，我将一行一行的讲解实现过程。附一个我写的SSD算法的详解链接。一、Backbone函数（基于VGG16） # 基于vgg16函数的backbone #b1 net = self.conv2d(x,filter=64,k_size=[3,3],scope=...

2019-04-01 15:24:11 5313 7

原创 YOLO V1全网最详细的解读

看了很多网上的关于YOLO的教程，发现大家都是相互抄袭，并没有很详细的讲解其中的算法，所以我结合网上的和自己的理解对其进行全网最详细讲解。一、YOLO：YOLO: Unified, Real-Time Object Detection概述YOLO作者将物体检测作为回归问题求解，基于一个简单的end-to-end网络设计，和rcnn系列的区别主要如下：1、YOLO训练和检测均是在一个单独的网络...

2019-03-28 15:15:40 10763 13

原创 AlignedReID: Surpassing Human-Level Performance in Person Re-Identification 详解

一、概述现有的方案大多数侧重于全局特征，无视行人的空间结构，会带来一些弊端和问题如下：

2018-11-19 14:08:24 1393

原创 Mask-guided Contrastive Attention Model for Person Re-Identification 详解

最近在看Re-ID相关的东西，现在把这篇paper记录一下。代码地址一、概述首先二元体掩码可以在两个方面为Re-ID做出贡献。1、掩模可以帮助消除像素级的背景杂波，这可以极大地提高ReID模型在各种背景条件下的鲁棒性。2、面具包含可被视为重要步态特征的体形信息。如果直接掩盖掉图像中的背景，会使得性能变差，具体的实验结果可以在作者文章4.3节见到，如下：二、网络结构：为了解决这个问题，作...

2018-11-17 11:49:26 1973 4

原创 Occlusion-aware R-CNN: Detecting Pedestrians in a Crowd 详解（遮挡下的行人检测）

文章地址：https://arxiv.org/pdf/1807.08407.pdf暂时没有放出源代码，如果有小伙伴找到代码的话欢迎留言给我。一、概述依然是解决在遮挡的情况下对人的检测的文章，作者分别从loss和two stage detector中核心的ROI Pooling操作这两个角度出发改善遮挡物体的检测问题。在之后我会根据这两个方面对文章进行一个简单的总结。先简单的放个在2.2中我将...

2018-11-12 09:33:46 5384 5

原创 Repulsion Loss: Detecting Pedestrians in a Crowd 详解（遮挡下的行人检测）

最近做新人检测Re-ID的工作，刚好记录一下对论文的阅读和个人理解。文章中部分内容为引用别人的，我在文章最后也给出了引用的文章链接。如有侵权，请联系我删除。一、综述行人检测中遮挡分为两种类型，一种是由于非目标造成的遮挡，文中作者称为Reasonable-occlusion，另外一种是由于也是需要检测的目标造成的遮挡，作者称为Reasonable-crowd。对于前一种类型遮挡，很难有针对性的办...

2018-11-11 11:11:31 6847 1

原创 Learning without Forgetting 详解（LwF）

一、概述这篇文章仍然从最简单的分类任务入手，巧妙运用了Knowledge Distill技术来缓解这样的问题。具体地，使用旧模型作为teacher model，对于新任务中的每一个样本。和传统的Finetune比起来，LwF使用了teacher model输出的soften softmax对新任务中的样本进行约束。二、网络结构详解对于一个CNN网络，对于shared参数θsθ_sθs，和...

2018-11-04 18:49:39 14483 1

原创语义分割总结（未完待续）

语义分割总结一、综述二、网络结构1）FCN2）SegNet3）U-Net如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入一、综述由于工作中很长一段时间都是在...

2018-11-01 11:01:10 7065 2

原创 Incremental Learning of Object Detectors without Catastrophic Forgetting详解

Incremental Learning of Object Detectors without Catastrophic Forgetting详解最近由于项目的需要在研究incremental learning在目标检测方面的应用，刚好读到了INRIA在2007年的一篇paper，采用蒸馏loss的方法来做incremental learning的，所以写这篇博客记录下来。概述不懂什么叫i...

2018-11-01 10:57:51 3935

原创 MobileNet v1 和 v2 记录

最近在搞检测的cpu部署，对inference阶段的响应时间有较高的要求，所以就对mobilenet的学习记录一下。一、MobileNet v1：先上一个结构：图a就是我们知道的标准意义的卷积，这个卷积可以等价于Depthwise和1x1的卷积的结合。那么为什么可以这样呢？我们先给出答案：depthwise conv只对输入通道进行卷积，没有对其进行组合来产生新的特征。因此下一...

2018-09-16 09:26:03 3191

原创反卷积(conv_transpose) vs 卷积(convolution)详解

一直对反卷机这个操作比较迷茫，在面试的过程中也经常被面试官问到反卷机的问题，所以就写这个博客简单的介绍一下反卷机的计算，并也卷积进行对比。...

2018-08-12 21:29:11 3689 1

原创 ResNet V1 vs V2详解

最近看李沐的gluon课程提到了conv、bn、relu等的顺序问题，现将resnet v1和v2总结如下。首先给出resnet v2的paper里面kaiming大神给出的不同的结构对比：图a为resnet v1的结构，图e为resnet v2的结构。（weight为conv层），左分支为identity分支，右分支为residual分支。图的结构有两个特点：1、conv-bn-...

2018-08-08 11:45:41 19475 4

原创感受野的计算方式

RF(当前层) = RF（前一层） + (kernel_size（当前层） - 1) x feature_stride（之前所有层的的stride相乘的加和，不包括当前层）如果有dilated conv的话，计算公式为：RF(当前层) = RF（前一层） + (kernel_size（当前层） - 1) x feature_stride（之前所有层的的stride相乘的加和，不包括当前层）...

2018-07-31 11:48:54 586

原创 SSD详解 + default box生成过程

在mxnet上面看李沐大神的视频，自己看了SSD的paper里面还是有些一知半解的东西，于是就用篇博客记录下来。文章中的图和部分见解都来自于网络有些错误的图已经修正，如有侵权，联系我删除。先放一张SSD算法的模型图。SSD采用不用卷积层的feature map进行综合，将VGG16的最后两层全连接改为卷积层并额外增加四个卷积层来达到构造网络。对于这5个不同尺度的卷积层输出的feature ...

2018-07-27 14:53:42 13870 11

原创 FPN的理解

本文记录一下我在看FPN这篇paper的时候已经自己用的时候的一些问题。本文中有些摘抄自别人的博客，如有侵权，望联系我删除。FPN的一个github：https://github.com/unsky/FPN一、介绍老样子先上图，图d即为FPN的核心。二、具体实现方法将图片送入预训练的特征网络中（如ResNet等），即构建所谓的bottom-up网络；构建对应的top-d...

2018-07-24 17:22:23 3553

原创 Senet学习记录

Senet是2017年Image Classification的冠军，本文主要是为了记录一下senet的block的结构。Senet主要做的是从空间维度上来提升网络的性能，于是就有了两个比较重要的操作，即：Squeeze和Excitation。其中Squeeze主要是顺着空间维度方向来进行压缩，将每个channel的二维的feature map经过global average pooling变成一...

2018-07-13 17:40:30 1514

原创 tensorflow冻结层的方法

最近在搞faster-rcnn的改动，网上看到很多人在做的一些改进，其中就包括冻结Bn等等方式，于是自己也就查了一下tensorflow里面冻结层的方法，现在总结如下：1、比如使用一个VGG的前面提取特征的部分，而微调其全连层，或者将其全连层更换为使用convolution来完成，可以使用TensorFlow的stop_gradient函数，将模型的一部分进行冻结。2、采用get_collecti...

2018-07-09 15:19:16 7961 1

原创 YOLO系列文章解读

看了很多网上的关于YOLO的教程，发现大家都是相互抄袭，并没有很详细的讲解其中的算法，所以我结合网上的和自己的理解对其进行全网最详细讲解。一、YOLO：YOLO: Unified, Real-Time Object DetectionYOLO作者将物体检测作为回归问题求解，基于一个简单的end-to-end网络设计，和rcnn系列的区别主要如下：1、YOLO训练和检测均是在一个单独的网...

2018-05-29 13:37:57 4537

原创 Inception模型中遇到的细节问题思考记录

声明：文章有部分内容为别人博客里面提到的，我觉得语言组织的很好所以就直接拿过来用了，如有侵权，请联系我删除或修改。一、Inception v1（GoogleNet）对左上图做以下说明： 1 . 采用不同大小（1x1,3x3,5x5,3x3的maxpooling）的卷积核意味着不同大小的感受野，最后拼接意味着不同尺度特征的融合； 2 . 之所以卷积核大小采用1、3和5，主要是为了方便对齐。设定卷积步...

2018-05-28 15:00:42 5493 4

原创 back propogation反向传播公式推导及其反向传播过程

2018-05-28 11:21:28 474

原创 densenet和resnet对比

问题：densenet什么时候效果比resnet好？答案：小数据集的时候，因为小数据集的时候容易产生过拟合，但是densenet能够很好的解决过拟合的问题，所以对于小数据集的情况下densenet的效果好于resnet。原因：DenseNet 具有非常好的抗过拟合性能，尤其适合于训练数据相对匮乏的应用。这一点从论文中 DenseNet 在不做数据增强（data augmentation）的 C...

2018-05-24 14:50:44 13361 2

原创 tensorflow手机端模型压缩

最近因为项目的需要，我们需要将tensorflow模型部署到手机端，所以必不可少的就是模型的优化加速和模型压缩，我这个文章主要是为了记录一下使用到的方法。https://github.com/tensorflow/tensorflow/tree/master/tensorflow/tools/graph_transforms...

2018-05-23 14:00:37 1442

原创 Faster rcnn 中的nms解读

最近在看faster rcnn相关的东西，也真好碰巧面试遇到手写nms代码这个环节，故本文将其记录下来以备日后使用。import numpy as np def py_cpu_nms(dets, thresh): """Pure Python NMS baseline.""" # 所有图片的坐标信息，字典形式储存？？ x1 = dets[:, 0] y...

2018-05-22 16:01:41 7024 2

原创最近邻插值和双线性插值的详细计算方法

2018-05-22 15:32:38 12091 4

原创 tensorflow代码过程中遇到的问题（持续更新）

# Variable conv1/weights/Adam/ does not exist, or was not created with tf.get_variable(). Did you mean to set reuse=tf.AUTO_REUSE in VarScope解决办法：with tf.variable_scope(tf.get_variable_scope()) as sco...

2018-05-18 15:53:37 662

原创 batch normalization 详解

Batch Normalization是2015年Google研究员在论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》一文中提出的，同时也将BN应用到了2014年的GoogLeNet上，也就是Inception-v2。 BN算法在很大程度上加速了训练过程，...

2018-05-18 14:55:34 4472 2

原创 faster rcnn中Roi pooling层的个人理解

每次看Faster rcnn的paper都能收获到不少东西，所以这个博客的目的就是为了记录自己看这篇paper的过程中的一些理解。本文为自己根据大家的博客的内容摘取和自己的理解汇合完成：Faster rcnn的整体构架：训练的大致过程：1、图片先缩放到MxN的尺寸，之后进入vgg16后得到（W/16，H/16）大小的feature map；2、对于得到的大小为（W/16，H/16）的feature...

2018-05-17 16:35:05 25540 8

空空如也

空空如也