自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 资源 (4)
  • 收藏
  • 关注

原创 【论文】人工智能前沿论文集

2020.2.16https://zhuanlan.zhihu.com/p/107060834,https://arxiv.org/pdf/2002.05709.pdfHinton组力作:ImageNet无监督学习最佳性能一次提升7%,媲美监督学习。https://www.zhihu.com/question/355779873,https://arxiv.org/pdf/1911...

2020-02-16 16:19:23 917

原创 【实验】bayes nms的缺点

0.实验设计首先通过ap指标来分析为什么bayes nms的效果差(在faster上面),之后结合nms动画来具体分析原因。1. 整体序号AP/AR说明NormalBayes1Average Precision (AP)@[ IoU=0.50:0.95 area= all maxDets=100 ]0.3770.3712Average Prec...

2019-12-25 16:52:31 523

原创 【论文】【实例分割】YOLACT

YOLACT: Real-time Instance Segmentationhttps://arxiv.org/abs/1904.02689https://zhuanlan.zhihu.com/p/62652145We present a simple, fully-convolutional model for real-time instance segmentation tha...

2019-10-16 09:48:49 449

原创 【其他】【思考】目标检测与mAp(1)

一、mAp(mean average precision)这一部分分析常见的mAp的计算方法。首先来介绍最常用的mAp计算方法(VOC2012中所用到的)。先做一个概述:检测器对每一张图片进行检测,给出DR b-box将所有图片的DR b-box集中,按照DR b-box给出的label进行分类对于每个类别: 将属于该类别的DR b-box按confidence降序排...

2019-10-15 14:24:09 359

原创 【论文】YOLO(You Only Look Once: Unified, Real-Time Object Detection)简介

一、简介在YOLO之前所采用得方法,通常是两个阶段(two-stage)的检测方法,首先生成大量的bbox(bounding box),之后根据bbox在特征层上的映射来进行分类(classification)以及进一步的bbox位置修正(regression)。而YOLO将目标检测问题化为了一个回归问题,直接从图像映射得到bbox和类别概率。它相比two-stage的方法有两个有点:1.快。...

2019-10-15 14:23:41 300

原创 【论文】R-FCN: Object Detection via Region-based Fully Convolutional Network总结

一、简介R-FCN是一个与faster r-cnn有类似结构的two-stage网络,首先通过一个网络共同提取特征,之后通过一个RPN来提出候选框,然后对候选框进行微调以及对物体进行识别。RPN与faster r-cnn一样,改变的是后面的网络,R-FCN使用了一种全卷积网络结构,降低了最后一层全连接层所带来的速度影响,而且提出了两个概念:translation-invariance以及tr...

2019-10-15 14:23:09 156

原创 【论文】目标检测中正负样本的选取总结

一、简介目标检测有大量的算法,这篇文章对其中正负样本的选取方法进行了总结。对于正样本,是回归与分类都进行,而负样本由于没有回归的对象,不进行回归,只进行分类(分类为背景)。二、正文1.Fast R-CNN构造如下:步骤是1.selective search -> ROIs -> 筛选 -> ROIs2.ROIs + feature map -&g...

2019-10-15 14:21:30 6461

原创 【实验】SNIP实验

1.SNIP1. 训练测试分辨率的domain shift这里的domain shift指的是测试和训练的图像分辨率不一致。实验目的探究该domain shift(测试和训练的图像分辨率不一致)的影响,并比较两种解决方案。实验:·网络名称训练测试CNN-B224*224先下采样到48* 48,64* 64, 80* 80, 96* 96, 128*128。之后...

2019-10-15 14:15:35 292

原创 【代码】mmdetection源码解读(Anchor head部分)

0.简介Anchor head主要是为了计算基于Anchor的损失函数,以及简单的回归。其中含有两个单层卷积,一个用来分类,一个用来回归,可以添加多层, 例如Retina head。以下代码的解读均依靠断点调试获得,使用的模型为faster r-cnn1.self.loss def loss(self, cls_scores, bb...

2019-10-15 14:08:58 3071 4

原创 【论文】Paper List

FSAF: Feature Selective Anchor-Free Module for Single-Shot Object Detection两个部件:anchor free 模块,layer选择模块。FreeAnchor:

2019-10-15 13:56:50 298

原创 【代码】【未完】COCO评价准则的Python代码解读

cocoeval.py的COCOeval类1. _prepare载入gts和dts,这两个都是列表,每一个元素包含bbox,img_id,类别等信息。如果存在ignore_id的话,将对应gt的’ignore’设置为TRUE self._gts = defaultdict(list) # gt for evaluation self._dts ...

2019-10-15 13:48:44 1274 1

原创 【代码】FoveaBox代码解读

0. FoveaBox论文: https://arxiv.org/abs/1904.03797代码;mmdetection1. _init_layers网络结构:reg_convs:4个卷积层cls_convs:4个卷积层,如果有deformable卷积。则有2个卷积,一个deform2. loss获得各layer中feature_map的shape,featmap_siz...

2019-10-14 16:25:23 798 3

原创 【代码】mmdetection源码解读(从score获得bboxes)

0. 简介anchor_head中的

2019-10-02 12:28:26 2575 3

原创 【实验】COCO数据集上的实验

1.MMdetection上的实验1.1 cascade_rcnn_x101CUDA_VISIBLE_DEVICES=3 python ./tools/test.py ./configs/cascade_rcnn_x101_64x4d_fpn_1x.py ./checkpoints/cascade_rcnn_x101_64x4d_fpn_2x_20181218-5add321e.pth --o...

2019-08-21 19:19:22 3098 7

原创 【代码】mmdetection中的mmdet.datasets

1.collate1.collate用来拼接batch中的数据。与标准的pytorch中的default_collate不同,这里的collate返回的是一个列表,每个列表中的元素是一个minibatch,应该是为了用于多个gpu,每个gpu上运行一个minibatch。collate支持对于DataContainer数据类型的操作,对于meta data,直接拼成minibatch,返回...

2019-08-15 21:26:42 5994 2

原创 【代码】mmdetection框架

0.前言这篇文章是使用mmdetection的记录,记录对于代码、设计理念的个人理解。1.记录使用tools.train进行训练。添加如下代码来使用debug模式: import os os.environ["CUDA_VISIBLE_DEVICES"] = "4" args = ['./configs/cascade_mask_rcnn_r101_fpn_1x.py...

2019-08-14 21:48:48 1970

原创 【代码】CenterNet使用(续)(对五六七部分详解)(七)

接上面部分,对五六七部分进行详解,这篇介绍第七部分。一、回顾第七部分进行最后的后处理: results = self.merge_outputs(detections) torch.cuda.synchronize() end_time = time.time() merge_time += end_time - post_process_time ...

2019-07-25 16:54:31 2909 3

原创 【代码】CenterNet使用(续)(对五六七部分详解)(六)

接上面部分,对五六七部分进行详解,这篇介绍第六部分。一、回顾第六部分对得到得dets进行后处理: dets = self.post_process(dets, meta, scale) torch.cuda.synchronize() post_process_time = time.time() post_time += post_pr...

2019-07-25 16:54:28 1798 4

原创 【代码】CenterNet使用(续)(对五六七部分详解)(五)

接上面部分,对五六七部分进行详解,这篇介绍第五部分,也就是model从建立到测试,数据从images到output、dets的详细过程。一、回顾第五部分放入网络中测试,产生输出: output, dets, forward_time = self.process(images, return_time=True)process部分在ctdet.py中: def...

2019-07-25 16:54:22 3365 10

原创 【代码】CenterNet使用(Detection)(demo.py)

一、运行demo.py按照readme里头的创建一个新环境,按照要求安装即可,中间也遇到了不少的问题,比如说一开始装上了torch0.4.1,之后不能安装torchvision,所以又升到了torch1.0,安装完torchvison之后又回退到了torch0.4.1版本。中间也遇到过DCNv2编译失败的情况,把失败的DCNv2删掉后再重新编译,安装了一些必要组件,好像是那个ffi的模块,然后...

2019-07-25 16:54:19 4833 15

原创 【代码】CenterNet的使用

一、数据集的准备(PASCOL VOC)首先将src/tools/get_pascal_voc.sh中涉及的数据集和工具都下载下来,之后在tools中建立voc文件夹,将数据集和工具放入到voc中,运行修改后的脚本:cd voctar xvf VOCtrainval_06-Nov-2007.tartar xvf VOCtest_06-Nov-2007.tartar xvf VOCd...

2019-07-25 16:54:14 2645 6

原创 【论文】SNIP - An Analysis of Scale Invariance in Object Detection

1.问题COCO数据集中存在的两个问题:1.大量小物体 2.尺度变化极大Therefore,most object instances in COCO are smaller than 1% of imagearea! To make matters worse, the scale of the smallest and largest 10%of object instances i...

2019-07-17 21:50:06 311

原创 【代码】CenterNet代码解析

这篇文章主要就是介绍一些用到的重要的函数,只介绍detection部分。0.网站https://github.com/xingyizhou/CenterNetinstall:https://github.com/xingyizhou/CenterNet/blob/master/readme/INSTALL.mddataset:https://github.com/xingy...

2019-06-14 16:56:16 20395 25

原创 【代码】NMS

# --------------------------------------------------------# Fast R-CNN# Copyright (c) 2015 Microsoft# Licensed under The MIT License [see LICENSE for details]# Written by Ross Girshick# --------...

2019-05-16 13:13:36 344

原创 【论文】Cascade R-CNN总结

一、简介Cascade R-CNN是为了解决训练时用来定义FP和TP的IOU值选取的问题,并且提出了一种结构来利用该IOU值不同所带来的好处,贡献体现在对于定位能力的改进上,也就是IOU值。一般而言,这个值定为了0.5,那么其他的值呢?作者做了实验,观察到以下现象:其中,图(d)中绘制的是随着定义TP的IOU阈值的变化,根据不同的u训练出来的检测器,AP的变化。可以看出来,在IO...

2019-04-08 11:13:51 1313 1

原创 【论文】YOLOv2

这里只简要介绍一下YOLOv2,谈谈想法。关于YOLOv2,下面的这篇介绍的已经很详尽了:https://www.jianshu.com/p/032b1eecb335首先罗列一些它做了什么:从上往下数:1.BN,在所有的卷积层后面添加BN层,移除dropout2.high resolution classifier,在高分辨图像上对分类网络finetune3.co...

2019-04-03 16:38:52 293

原创 【论文】OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks总结

趁热打铁,把OverFeat总结了。一、简介这个文章中提出了一种较为通用的结构,并将其应用在了识别(classification)、定位(localization,只有一个物体,要给出位置)、检测(detection,可能有0到多个物体)。并且将其使用的特征提取器命名为了OverFeat(仅仅是一个名字,文中也没有给出解释)。这篇论文或许是很早一批将CNN利用到多种不同任务上的一种尝试,因...

2019-03-30 11:27:04 238

原创 【论文】SPP(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)

本来是打算总结R-FCN的,但是我发现SPP和Over-Feat在很多地方都有提到,所以先对这两个东西进行一个总结。SPP网络的思想很简单,但是这篇论文却写出了很多东西,这一点很值得学习。一、简介SPP的提出是为了解决CNN固定输入的问题,这导致了在面对不同大小图片的时候,它只能使用裁剪或者缩放的方法获得与CNN输入大小一致的图片,但是这些方法会对物体产生形变,会丢失信息。SPP有几个很...

2019-03-29 21:16:32 639

原创 【论文】SSD: Single Shot MultiBox Detector简介

一、简介SSD提出于2016年三月20日,比YOLO v1早两个月,但是它其中提到了YOLO,所以应该是比YOLO晚的。SSD也是一个one stage方法,它其中的改进包括:1.使用小卷积及取预测类别和定位偏差,2.使用不同的filter去对于不同宽高比(aspect ratio)进行判断,3.在多个feature map上进行判断。二、基本思想对于每个feature...

2019-03-28 22:42:21 220

原创 【论文】YOLOv1

YOLOv1的结构很简单,和一般的分类网络差别不大。主要是损失函数的设计以及对于训练过程的设计,还有就是网络输出代表的含义。YOLOv1的输出是一个7*7的矩阵,它假设网络相应index的输出对应于输入图片相应的grid,每个index对应几个b-box,这个b-box是有限定的,它的中心处于grid中,因此我们的目标之一应该是是判断grid中是否包含某个物体的中心,假如中心没有包含在gr...

2019-03-28 15:31:37 154

原创 【其他】【思考】目标检测的目标以及mAp(0)

一、简介目标检测(object detection)是一个CV中一个经典的问题,相对于物体识别任务而言,它更加的复杂,应用也更加的广泛。目标检测(以下指general object detection)的任务是在场景中检测出给定的一组类别中所有的物体,这个类别组通常包含很多的类别,例如20类,为的是体现出检测任务的普适性(general)。检测分为两步,第一是对物体的位置(location)以...

2019-03-24 15:08:51 1090 1

原创 SVM研究(0)

最近一直在看SVM的一些论文,想做一下总结,因为发现以前看过的有关SVM的博客大多数都没有说的很清楚(反正我是还有细节没有搞懂),希望这篇文章能给一些人带来帮助,但主要是用来总结吧。 首先说SVM的来源。SVM是一个线性分类器,最开始的想法是要建立出一个比较稳定的线性分类器,由此便从几何上给出了一个使得间隔最大化的模型,当然,假设数据是线性可分的。 1. 我们先说说什么...

2018-07-16 18:40:03 417

原创 SVM研究(1)

上次说到如何推导出硬间隔的线性SVM,这次我们将它拓展一下,写成一个无约束问题,然后与logistic回归化为同一个形式。(1)软间隔SVM(1)这个式子是我们一般的SVM问题(硬间隔),在添加松弛约束的变量后,可以被转化为软间隔的SVM:...

2018-07-16 18:39:39 375

原创 SVM研究(2)

上回介绍了软间隔的SVM,但是还都是局限于原问题(primal problem)的形式,有一些算法是针对对偶问题(dual problem)提出的,所以这次就把对偶问题推导出来。我们对问题做一个简化,将替换为,对应的,每一个样本替换为增加一个维度,这样子就变为。事实表明,这的确是某些算法得以成立的重要步骤。(1)L1-SVM的对偶问题...

2018-07-16 18:39:25 722

翻译 显著度论文阅读(0)

        这几个月一直在看显著度方面的论文,断断续续的,不成体系,一会儿看看生物方面的东西,一会儿又要看看图相处理方面的东西,什么方面都有涉及,挺杂的。最开始看得是11年的一篇,看的挺开心,因为讲得很简单的样子,之后又看了14年的一篇《Salient Object Detection: A Survey》,是一个综述,虽然内容也不难,但是总是也看不懂,拖了几个月了连这一篇都没看完,决定对这篇...

2018-04-22 11:27:04 521

目标检测论文集.rar

目标检测的一些经典论文。里头有些论文有注释,可以通过重新打印成pdf来获得空白文档。

2019-07-26

CenterNet原版可运行.rar

CenterNet编译好的版本(Objects as Points),使用的环境请依照github上的说明自行配置。

2019-07-26

COCO和Pascal VOC数据集可视化工具.rar

包含COCO数据集和VOC数据集的可视化代码以供参考,其中show_b-box代表可视化,form_index是用来简化标签的工具,为了转换数据集的格式,先运行form_index再运行show_b-box。注意修改代码内的路径@@

2019-07-26

Mnist Datasets.rar

包含pytorch使用的mnist数据集以及mnist原始数据集。用来实验

2019-07-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除