FSALICEALEX-CSDN博客

原创【论文】人工智能前沿论文集

2020.2.16https://zhuanlan.zhihu.com/p/107060834，https://arxiv.org/pdf/2002.05709.pdfHinton组力作：ImageNet无监督学习最佳性能一次提升7%，媲美监督学习。https://www.zhihu.com/question/355779873，https://arxiv.org/pdf/1911...

2020-02-16 16:19:23 917

原创【实验】bayes nms的缺点

0.实验设计首先通过ap指标来分析为什么bayes nms的效果差（在faster上面），之后结合nms动画来具体分析原因。1. 整体序号AP/AR说明NormalBayes1Average Precision (AP)@[ IoU=0.50:0.95 area= all maxDets=100 ]0.3770.3712Average Prec...

2019-12-25 16:52:31 523

原创【论文】【实例分割】YOLACT

YOLACT: Real-time Instance Segmentationhttps://arxiv.org/abs/1904.02689https://zhuanlan.zhihu.com/p/62652145We present a simple, fully-convolutional model for real-time instance segmentation tha...

2019-10-16 09:48:49 449

原创【其他】【思考】目标检测与mAp(1)

一、mAp(mean average precision)这一部分分析常见的mAp的计算方法。首先来介绍最常用的mAp计算方法（VOC2012中所用到的）。先做一个概述：检测器对每一张图片进行检测，给出DR b-box将所有图片的DR b-box集中，按照DR b-box给出的label进行分类对于每个类别：将属于该类别的DR b-box按confidence降序排...

2019-10-15 14:24:09 359

原创【论文】YOLO（You Only Look Once: Uniﬁed, Real-Time Object Detection）简介

一、简介在YOLO之前所采用得方法，通常是两个阶段(two-stage)的检测方法，首先生成大量的bbox（bounding box），之后根据bbox在特征层上的映射来进行分类(classification)以及进一步的bbox位置修正（regression）。而YOLO将目标检测问题化为了一个回归问题，直接从图像映射得到bbox和类别概率。它相比two-stage的方法有两个有点：1.快。...

2019-10-15 14:23:41 300

原创【论文】R-FCN: Object Detection via Region-based Fully Convolutional Network总结

一、简介R-FCN是一个与faster r-cnn有类似结构的two-stage网络，首先通过一个网络共同提取特征，之后通过一个RPN来提出候选框，然后对候选框进行微调以及对物体进行识别。RPN与faster r-cnn一样，改变的是后面的网络，R-FCN使用了一种全卷积网络结构，降低了最后一层全连接层所带来的速度影响，而且提出了两个概念：translation-invariance以及tr...

2019-10-15 14:23:09 156

原创【论文】目标检测中正负样本的选取总结

一、简介目标检测有大量的算法，这篇文章对其中正负样本的选取方法进行了总结。对于正样本，是回归与分类都进行，而负样本由于没有回归的对象，不进行回归，只进行分类（分类为背景）。二、正文1.Fast R-CNN构造如下：步骤是1.selective search -> ROIs -> 筛选 -> ROIs2.ROIs + feature map -&g...

2019-10-15 14:21:30 6461

原创【实验】SNIP实验

1.SNIP1. 训练测试分辨率的domain shift这里的domain shift指的是测试和训练的图像分辨率不一致。实验目的探究该domain shift（测试和训练的图像分辨率不一致）的影响，并比较两种解决方案。实验：·网络名称训练测试CNN-B224*224先下采样到48* 48,64* 64, 80* 80, 96* 96, 128*128。之后...

2019-10-15 14:15:35 292

原创【代码】mmdetection源码解读（Anchor head部分）

0.简介Anchor head主要是为了计算基于Anchor的损失函数，以及简单的回归。其中含有两个单层卷积，一个用来分类，一个用来回归，可以添加多层，例如Retina head。以下代码的解读均依靠断点调试获得，使用的模型为faster r-cnn1.self.loss def loss(self, cls_scores, bb...

2019-10-15 14:08:58 3071 4

原创【论文】Paper List

FSAF: Feature Selective Anchor-Free Module for Single-Shot Object Detection两个部件：anchor free 模块，layer选择模块。FreeAnchor：

2019-10-15 13:56:50 298

原创【代码】【未完】COCO评价准则的Python代码解读

cocoeval.py的COCOeval类1. _prepare载入gts和dts，这两个都是列表，每一个元素包含bbox，img_id，类别等信息。如果存在ignore_id的话，将对应gt的’ignore’设置为TRUE self._gts = defaultdict(list) # gt for evaluation self._dts ...

2019-10-15 13:48:44 1274 1

原创【代码】FoveaBox代码解读

0. FoveaBox论文： https://arxiv.org/abs/1904.03797代码；mmdetection1. _init_layers网络结构：reg_convs：4个卷积层cls_convs：4个卷积层，如果有deformable卷积。则有2个卷积，一个deform2. loss获得各layer中feature_map的shape，featmap_siz...

2019-10-14 16:25:23 798 3

原创【代码】mmdetection源码解读（从score获得bboxes）

0. 简介anchor_head中的

2019-10-02 12:28:26 2575 3

原创【实验】COCO数据集上的实验

1.MMdetection上的实验1.1 cascade_rcnn_x101CUDA_VISIBLE_DEVICES=3 python ./tools/test.py ./configs/cascade_rcnn_x101_64x4d_fpn_1x.py ./checkpoints/cascade_rcnn_x101_64x4d_fpn_2x_20181218-5add321e.pth --o...

2019-08-21 19:19:22 3098 7

原创【代码】mmdetection中的mmdet.datasets

1.collate1.collate用来拼接batch中的数据。与标准的pytorch中的default_collate不同，这里的collate返回的是一个列表，每个列表中的元素是一个minibatch，应该是为了用于多个gpu，每个gpu上运行一个minibatch。collate支持对于DataContainer数据类型的操作，对于meta data，直接拼成minibatch，返回...

2019-08-15 21:26:42 5994 2

原创【代码】mmdetection框架

0.前言这篇文章是使用mmdetection的记录，记录对于代码、设计理念的个人理解。1.记录使用tools.train进行训练。添加如下代码来使用debug模式： import os os.environ["CUDA_VISIBLE_DEVICES"] = "4" args = ['./configs/cascade_mask_rcnn_r101_fpn_1x.py...

2019-08-14 21:48:48 1970

原创【代码】CenterNet使用（续）（对五六七部分详解）（七）

接上面部分，对五六七部分进行详解，这篇介绍第七部分。一、回顾第七部分进行最后的后处理： results = self.merge_outputs(detections) torch.cuda.synchronize() end_time = time.time() merge_time += end_time - post_process_time ...

2019-07-25 16:54:31 2909 3

原创【代码】CenterNet使用（续）（对五六七部分详解）（六）

接上面部分，对五六七部分进行详解，这篇介绍第六部分。一、回顾第六部分对得到得dets进行后处理： dets = self.post_process(dets, meta, scale) torch.cuda.synchronize() post_process_time = time.time() post_time += post_pr...

2019-07-25 16:54:28 1798 4

原创【代码】CenterNet使用（续）（对五六七部分详解）（五）

接上面部分，对五六七部分进行详解，这篇介绍第五部分，也就是model从建立到测试，数据从images到output、dets的详细过程。一、回顾第五部分放入网络中测试，产生输出： output, dets, forward_time = self.process(images, return_time=True)process部分在ctdet.py中： def...

2019-07-25 16:54:22 3365 10

原创【代码】CenterNet使用（Detection）（demo.py）

一、运行demo.py按照readme里头的创建一个新环境，按照要求安装即可，中间也遇到了不少的问题，比如说一开始装上了torch0.4.1，之后不能安装torchvision，所以又升到了torch1.0，安装完torchvison之后又回退到了torch0.4.1版本。中间也遇到过DCNv2编译失败的情况，把失败的DCNv2删掉后再重新编译，安装了一些必要组件，好像是那个ffi的模块，然后...

2019-07-25 16:54:19 4833 15

原创【代码】CenterNet的使用

一、数据集的准备（PASCOL VOC）首先将src/tools/get_pascal_voc.sh中涉及的数据集和工具都下载下来，之后在tools中建立voc文件夹，将数据集和工具放入到voc中，运行修改后的脚本：cd voctar xvf VOCtrainval_06-Nov-2007.tartar xvf VOCtest_06-Nov-2007.tartar xvf VOCd...

2019-07-25 16:54:14 2645 6

原创【论文】SNIP - An Analysis of Scale Invariance in Object Detection

1.问题COCO数据集中存在的两个问题：1.大量小物体 2.尺度变化极大Therefore,most object instances in COCO are smaller than 1% of imagearea! To make matters worse, the scale of the smallest and largest 10%of object instances i...

2019-07-17 21:50:06 311

原创【代码】CenterNet代码解析

这篇文章主要就是介绍一些用到的重要的函数，只介绍detection部分。0.网站https://github.com/xingyizhou/CenterNetinstall:https://github.com/xingyizhou/CenterNet/blob/master/readme/INSTALL.mddataset:https://github.com/xingy...

2019-06-14 16:56:16 20395 25

原创【代码】NMS

2019-05-16 13:13:36 344

原创【论文】Cascade R-CNN总结

一、简介Cascade R-CNN是为了解决训练时用来定义FP和TP的IOU值选取的问题，并且提出了一种结构来利用该IOU值不同所带来的好处，贡献体现在对于定位能力的改进上，也就是IOU值。一般而言，这个值定为了0.5，那么其他的值呢？作者做了实验，观察到以下现象：其中，图(d)中绘制的是随着定义TP的IOU阈值的变化，根据不同的u训练出来的检测器，AP的变化。可以看出来，在IO...

2019-04-08 11:13:51 1313 1

原创【论文】YOLOv2

这里只简要介绍一下YOLOv2，谈谈想法。关于YOLOv2，下面的这篇介绍的已经很详尽了：https://www.jianshu.com/p/032b1eecb335首先罗列一些它做了什么：从上往下数：1.BN，在所有的卷积层后面添加BN层，移除dropout2.high resolution classifier，在高分辨图像上对分类网络finetune3.co...

2019-04-03 16:38:52 293

原创【论文】OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks总结

趁热打铁，把OverFeat总结了。一、简介这个文章中提出了一种较为通用的结构，并将其应用在了识别(classification)、定位(localization，只有一个物体，要给出位置)、检测（detection，可能有0到多个物体）。并且将其使用的特征提取器命名为了OverFeat（仅仅是一个名字，文中也没有给出解释）。这篇论文或许是很早一批将CNN利用到多种不同任务上的一种尝试，因...

2019-03-30 11:27:04 238

原创【论文】SPP(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)

本来是打算总结R-FCN的，但是我发现SPP和Over-Feat在很多地方都有提到，所以先对这两个东西进行一个总结。SPP网络的思想很简单，但是这篇论文却写出了很多东西，这一点很值得学习。一、简介SPP的提出是为了解决CNN固定输入的问题，这导致了在面对不同大小图片的时候，它只能使用裁剪或者缩放的方法获得与CNN输入大小一致的图片，但是这些方法会对物体产生形变，会丢失信息。SPP有几个很...

2019-03-29 21:16:32 639

原创【论文】SSD: Single Shot MultiBox Detector简介

一、简介SSD提出于2016年三月20日，比YOLO v1早两个月，但是它其中提到了YOLO，所以应该是比YOLO晚的。SSD也是一个one stage方法，它其中的改进包括：1.使用小卷积及取预测类别和定位偏差，2.使用不同的filter去对于不同宽高比(aspect ratio)进行判断，3.在多个feature map上进行判断。二、基本思想对于每个feature...

2019-03-28 22:42:21 220

原创【论文】YOLOv1

YOLOv1的结构很简单，和一般的分类网络差别不大。主要是损失函数的设计以及对于训练过程的设计，还有就是网络输出代表的含义。YOLOv1的输出是一个7*7的矩阵，它假设网络相应index的输出对应于输入图片相应的grid，每个index对应几个b-box，这个b-box是有限定的，它的中心处于grid中，因此我们的目标之一应该是是判断grid中是否包含某个物体的中心，假如中心没有包含在gr...

2019-03-28 15:31:37 154

原创【其他】【思考】目标检测的目标以及mAp(0)

一、简介目标检测（object detection）是一个CV中一个经典的问题，相对于物体识别任务而言，它更加的复杂，应用也更加的广泛。目标检测（以下指general object detection）的任务是在场景中检测出给定的一组类别中所有的物体，这个类别组通常包含很多的类别，例如20类，为的是体现出检测任务的普适性（general）。检测分为两步，第一是对物体的位置（location）以...

2019-03-24 15:08:51 1090 1

原创 SVM研究（0）

最近一直在看SVM的一些论文，想做一下总结，因为发现以前看过的有关SVM的博客大多数都没有说的很清楚（反正我是还有细节没有搞懂），希望这篇文章能给一些人带来帮助，但主要是用来总结吧。首先说SVM的来源。SVM是一个线性分类器，最开始的想法是要建立出一个比较稳定的线性分类器，由此便从几何上给出了一个使得间隔最大化的模型，当然，假设数据是线性可分的。 1. 我们先说说什么...

2018-07-16 18:40:03 417

原创 SVM研究（1）

上次说到如何推导出硬间隔的线性SVM，这次我们将它拓展一下，写成一个无约束问题，然后与logistic回归化为同一个形式。(1)软间隔SVM(1)这个式子是我们一般的SVM问题（硬间隔），在添加松弛约束的变量后，可以被转化为软间隔的SVM：...

2018-07-16 18:39:39 375

原创 SVM研究（2）

上回介绍了软间隔的SVM，但是还都是局限于原问题（primal problem）的形式，有一些算法是针对对偶问题（dual problem）提出的，所以这次就把对偶问题推导出来。我们对问题做一个简化，将替换为，对应的，每一个样本替换为增加一个维度，这样子就变为。事实表明，这的确是某些算法得以成立的重要步骤。（1）L1-SVM的对偶问题...

2018-07-16 18:39:25 722

翻译显著度论文阅读（0）

这几个月一直在看显著度方面的论文，断断续续的，不成体系，一会儿看看生物方面的东西，一会儿又要看看图相处理方面的东西，什么方面都有涉及，挺杂的。最开始看得是11年的一篇，看的挺开心，因为讲得很简单的样子，之后又看了14年的一篇《Salient Object Detection: A Survey》，是一个综述，虽然内容也不难，但是总是也看不懂，拖了几个月了连这一篇都没看完，决定对这篇...

2018-04-22 11:27:04 521

目标检测论文集.rar

目标检测的一些经典论文。里头有些论文有注释，可以通过重新打印成pdf来获得空白文档。

2019-07-26

CenterNet原版可运行.rar

CenterNet编译好的版本（Objects as Points），使用的环境请依照github上的说明自行配置。

2019-07-26

COCO和Pascal VOC数据集可视化工具.rar

包含COCO数据集和VOC数据集的可视化代码以供参考，其中show_b-box代表可视化，form_index是用来简化标签的工具，为了转换数据集的格式，先运行form_index再运行show_b-box。注意修改代码内的路径@@

2019-07-26

Mnist Datasets.rar

包含pytorch使用的mnist数据集以及mnist原始数据集。用来实验

2019-07-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人