自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Meringue's Blog

Cease to struggle and you cease to live

  • 博客(62)
  • 收藏
  • 关注

原创 目标定位与检测系列(16):FCOS

文章目录摘要动机FCOS检测框架整体框架FPN用于FCOSCenter-ness用于FCOS实验结果总结总结摘要我们提出了一个全卷积一阶段目标检测框架,以类似于实例分割的逐像素预测方式来解决目标检测问题。目前几乎所有顶尖的目标检测框架(如RetinaNet,SSD,YOLOv3,Faster R-CNN等)都依赖于预定义的锚框。相反,我们提出的FCOS目标检测框架不需要锚框,当然也不需要候选框。由于移除了大量预定义的锚框,FCOS避免了大量关于锚框的复杂运算,如训练过程中计算框的重叠程度。更重要的是,F

2021-01-19 22:39:25 529

原创 论文笔记:再看ResNet——ResNet典型网络结构

前言第一次看ResNet论文的时候,由于刚接触深度学习不久,对ResNet的理解仅仅停留在论文中阐述的一些基本思想。加上当时实验室的硬件条件很有限,用的模型基本上以AlexNet和VGG为主,并没有在学习中使用过ResNet。因此忽略了论文中提出的几种典型ResNet网络。一直到工作后,才发现ResNet的几种典型结构在诸多计算机视觉任务中都充当着非常重要的角色,因此很有必要更细致地了解一下ResNet的经典网络。若是刚接触ResNet,还是建议从最论文开始看起,我自己也写过一遍对于ResNet原理的简单

2020-06-11 15:17:04 8507 3

原创 目标定位与检测系列(15):目标检测常用损失函数

文章目录类别损失Cross Entropy LossFocal Loss位置损失L1 LossL2 LossSmooth L1 LossIoU LossGIoU LossDIoU LossCIoU Loss一般的目标检测模型包含两类损失函数,一类是类别损失(分类),另一类是位置损失(回归)。这两类损失函数往往用于检测模型最后一部分,根据模型输出(类别和位置)和实际标注框(类别和位置)分别计算类别...

2020-03-27 14:51:52 2860 3

原创 目标定位与检测系列(14):Libra R-CNN

论文地址:https://arxiv.org/pdf/1904.02701.pdf摘要相比于模型框架,模型的训练过程对于检测器是否成功也同样重要。在本文工作中,我们重新研究了标准的训练过程,发现检测的性能经常受限于模型训练过程中的不平衡。这种不平衡包括以下3个层面:采样层面、特征层面和目标层面。为了缓和着中国不平嗯带来的不利影响,我们提出了一种简单有效的面向目标检测中的不平衡学习的框架,即Li...

2019-12-09 22:40:19 927

原创 目标定位与检测系列(13):TridentNet

摘要尺度变化是目标检测领域中的重要挑战之一。在本文工作中,我们做实验研究了目标检测中感受野对于尺度变化的影响。基于这些实验结论,我们提出了一种新颖的三叉戟网络(TridentNet),旨在生成特定大小的特征图。我们构建了一个多支路并行的网络结构,每个分支共享参数但感受野不同。之后对于每一条分支,我们将目标采样到合适的尺寸用于训练。我们还提出了一个快速版的TridentNet(置用一条支路进行推理...

2019-11-03 22:59:17 629

原创 目标定位与检测系列(12):RetinaNet

摘要目前目标检测任务中精度最高的模型是基于主流的R-CNN框架的二阶段模型,该类方法在一些列目标候选框上进行分类。相对的,一阶段模型直接在大量的可能包含目标的区域进行检测,这样做速度更快但相比于两阶段模型也牺牲了精度,我们在本文工作中分析了这个问题的原因。我们发现训练过程中正负样本(指前景和背景)之间严重的不平衡是主要原因。我们通过修改标准的交叉信息熵损失函数来解决类别之间的不平衡,使得那些被很...

2019-10-22 22:42:35 1239

原创 目标定位与检测系列(11):Cascade R-CNN

摘要在目标检测中,使用IOU来定义正负样本。用比较低的IOU阈值(如0.5)训练得到的模型在检测时往往包含噪声。相反地,如果增加IOU阈值,检测性能会下降。产生这种现象的原因有两个:(1)训练过程中正样本的迅速减少导致的过拟合;(2)训练和推理阶段IOU阈值的不匹配。本文提出一个多阶段检测模型Cascade R-CNN来解决上述问题。这个模型由一系列用递增的IOU阈值训练的模型组成,因此对于困难...

2019-10-19 14:34:55 655

原创 QT5 +OpenCV3环境配置(Ubuntu和windows)

QT + OpenCV +Ubuntu环境QT 5.9.xOpenCV 3.4Ubuntu 18.04步骤下载QT(官网)、OpenCV源码编译OpenCV(略)QT新建工程中修改pro文件# 增加的内容# 头文件包含路径INCLUDEPATH += /usr/local/include \ /usr/local/include/open...

2019-07-13 00:53:42 675

原创 目标定位与检测系列(10):YOLOv3

论文原文地址:YOLOv3摘要我们针对YOLO提供了一些改进。我们在设计上做出了一些改变让它效果更好。我们也训练了这个相当好的网络。它比之前的网络大一点但是准确率更高。不用担心,它的速度依然很快。在320*320的图片上,YOLOv3可以达到单张图片检测速度22ms、28.2的mAP,和SSD准确率一样但速度是它的3倍。在使用以前的IOU mAP标准上,YOLOv3表现非常好。在一个Titan...

2019-05-28 19:38:03 2734

原创 目标定位与检测系列(9):YOLOv2 (YOLO9000)

本文主要介绍YOLOv2部分,最后一部分的YOLO9000看的不是太明白,有兴趣的可以直接看论文原文 。摘要我们在本文介绍YOLO9000,它是目前最好的实时的目标检测系统,可以检测超过9000种目标。首先我们提出一些对YOLO检测方法的改进措施,这些方法都很新颖,是基于前人的工作总结出来的。改进的YOLOv2模型在PASCAL VOC和COCO等标准的检测任务中取得了最好的结果。采用新颖的多...

2019-05-28 19:37:52 1598

原创 目标定位与检测系列(8):You Only Look Once (YOLO)

论文原文链接:摘要我们提出了YOLO网络,它是一种新的目标检测方法。之前方法将目标检测问题转化成分类问题来处理。在这篇文章中,我们把边界框回归和对应的目标分类统一成一个回归问题,即用一个单一的网络直接从一整张图片中预测出边界框和类别概率信息。由于整个检测流程是一个单一网络,它可以在检测任务上端到端地训练。我们的检测框架非常快。我们的基本YOLO模型处理图片的速度可以达到每秒45帧的实时...

2019-05-28 19:37:39 1156

原创 目标定位和检测系列(7):Faster R-CNN

论文原文链接:https://arxiv.org/abs/1506.01497虽然网上已经有一大堆优秀的博客介绍了Faster R-CNN,但还是希望自己也写一遍,加深理解。摘要最先进的目标检测网络基于候选区域算法来生成候选目标位置。像SPP-net和Fast R–CNN这样先进的模型已经减少了目标检测网络的运行时间,也暴露出候选区域的计算(速度)是一个瓶颈。本文介绍一种候选区域网...

2019-05-28 19:37:25 1350

原创 目标定位和检测系列(6):Fast R-CNN

论文原文:Fast R-CNNFast R-CNN是在R-CNN的基础上借鉴了SPP-net的一些优点改进得到的。整体的框架和R-CNN相似。摘要本文提出了R-CNN的一个快速版本(Fast R-CNN)用于目标检测。Fast R-CNN建立在之前工作的基础上,用深层卷积网络对目标区域快速分类。和之前的工作相比,Fast R-CNN采用了一些创新,使得在提高检测精度的同时也提高了训...

2019-05-28 19:37:08 1139

原创 目标定位和检测系列(5):综述性文章汇总

从RCNN到SSD,这应该是最全的一份目标检测算法盘点深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD深度学习目标检测概览干货 | 物体检测算法全概述:从传统检测方法到深度神经网络框架基于深度学习的「目标检测」算法综述综述:深度学习时代的目标检测算法...

2019-05-28 19:36:54 1472

原创 目标定位和检测系列(4): 金字塔池化 (SPP-net)

论文原文链接:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition虽然这篇文章的标题说是将金字塔池化用在目标识别上的。但是文章最后将它进一步用在了目标检测任务上,很好地解决了R-CNN方法在目标检测上的部分问题,最终也取得了不错的效果。所以也很有必要好好学习一下这篇论文。摘要现有...

2019-05-28 19:36:39 1329

原创 目标定位和检测系列(3):交并比(IOU)和非极大值抑制(NMS)的python实现

交并比(Intersection over Union)和非极大值抑制是(Non-Maximum Suppression)是目标检测任务中非常重要的两个概念。例如在用训练好的模型进行测试时,网络会预测出一系列的候选框。这时候我们会用NMS来移除一些多余的候选框。即移除一些IOU值大于某个阈值的框。然后在剩下的候选框中,分别计算与ground truth的IOU值,通常会规定当候选框和ground ...

2019-05-28 19:36:24 28855 16

原创 目标定位和检测系列(2):Region-Based Convolutional Network (R-CNN)

论文原文链接: https://www.ncbi.nlm.nih.gov/pubmed/26656583 R-CNN作为把深度学习用在目标检测任务上的开篇之作,于2014年被CVPR接收。虽然现在看来R-CNN的精度和速度已经略显不足,但文中提出的很多思想,包括后续提出的Fast R-CNN和Faster R-CNN,一直被目标检测领域的论文沿用。摘要目标检测在权威的PASCAL V...

2019-05-28 19:36:07 4288

原创 Faster R-CNN TensorFlow代码笔记(1)--模型测试

本文主要记录在看Faster R-CNNT的TensorFlow实现代码(模型测试部分),源码链接是:Faster-RCNN_TF,为了便于做笔记,我fork过来并添加了自己的注释和一些测试代码(目前只看了测试部分代码)。链接在:https://github.com/ZhouJiaHuan/Faster-RCNN_TF。 后期会不定期更新。本文的思路是从demo.py开始的,它的功能是依次读取本...

2018-12-31 12:54:32 1971

原创 用TensorFlow实现一个在CIFAR-10数据集上80%准确率的卷积神经网络

本文主要介绍如何在TensorFlow上训练CIFAR-10数据集并达到80%的测试准确率。会涉及CIFAR-10数据处理、TensorFlow基本的卷积神经网络层(卷积层、池化层、激活函数等),所使用的代码没有经过仔细的封装,比较适合刚接触TensorFlow的同学,完整的代码可以在我的Github上下载:cifar10-CNN。(PS:虽然网上有很多用TensorFlow训练CIFAR-10...

2018-11-26 19:45:43 3985 12

原创 Python中字符串的常用操作

字符串是Python中最重要的数据类型之一。在以前的学习中却一直没太重视。因此,今天特地将字符串的一些基本操作记录下来。部分内容参考了《Python基础教程(第3版)》。序列的通用操作字符串是Python内置序列(其他的序列类型如列表、元祖等),因此具备通用序列的操作。索引和切片字符串的索引和列表一样,都是从0开始,-1表示最后位置的索引。str1 = "abc123"pri...

2018-08-13 18:52:41 513

原创 NAO机器人高尔夫中的视觉系统设计

去年(2017)年分别参加了江苏省和全国的NAO机器人高尔夫比赛,负责的是视觉部分编程。在这里把之前的工作总结一下。内容主要包括红球和黄杆的识别和定位(包括在比赛中遇到的一些问题和解决办法)。完整的代码(C++和Python两个版本)见https://github.com/ZhouJiaHuan/nao-golf-visual-task,本篇只以Python代码为例进行介绍。基本配置(基类)...

2018-08-01 23:33:10 11601 36

原创 用MATLAB GUI做一个简单的绩点计算界面

本文主要记录如何用MATLAB自带的GUI功能做一个绩点计算界面。并以此来简单介绍一下MATLAB GUI的使用过程。完整代码见:https://github.com/ZhouJiaHuan/compute-GPA-master启动guide工具箱guide是MATLAB用来制作GUI界面的工具性,我们只要在MATLAB命令窗口中输入命令guide即可打开GUI制作界面,如下图: ...

2018-07-24 09:02:11 22597 41

原创 python中的*args和**kwargs

在Python中定义函数的时候,有时会看到输入参数中有*args和**kwargs,简单的说,它们都是用来存放输入的参数的,只不过存放的方式不一样。args以元祖的方式存放参数,kwargs以字典的方式存放。具体该怎么用可以看下面的一个简单的例子:""" A simple example of *args and **kwargs.Author: MeringueDate: 2018/...

2018-07-01 19:23:17 2364

原创 python中字典的替代品easydict

easydict相当于是python中字典的替代品,使用起来更加简洁方便,使用前需要先安装:pip install easydictpython中的字典访问元素的方式使用“[ ]”, 而easydict使用“.”,这一点就像MATLAB中的结构体。一个栗子:""" A simple example of easydict module.Author: MeringueD...

2018-06-25 17:25:35 1846

原创 一次不太成功的项目实战:HOG特征+SVM实现交通标志的检测

本文主要讲如何通过HOG特征和SVM分类器实现部分交通标志的检测。本文中的所有代码都可以在我的github主页上下载:https://github.com/ZhouJiaHuan。由于能力有限,本文的检测思路很简单,主要是用来自己练习编程用,也顺便发布出来供需要的人参考。博客或代码中遇到的任何问题,欢迎指出,希望能相互学习。废话不多说了,下面就来一步步介绍我的检测过程。数据集数据集都是...

2018-06-02 17:18:32 24831 114

翻译 梯度方向直方图Histogram of Oriented Gradients (HOG)

在学习HOG特征的时候,发现一片英文文章讲得浅显易懂。因此翻译在这里学习。(文中的图片均来自翻译原文)原文链接:Histogram of Oriented Gradients什么是特征描述子特征描述子一张图片或者一个图片块的一种表示,通过提取有用信息并扔掉多余的信息来简化图像。通常,特征描述子将一张大小为width×height×3 (通道数)的图片化成一个长度为n的特征向量/...

2018-05-08 00:40:18 13991 12

原创 用网线实现两台电脑之间的文件共享

配置步骤将一根网线分别插入两台电脑的网口这个。。。没什么要说的吧。。。配置电脑IP假设我们现在有两台电脑A,B,我们想把电脑A上的某个文件或者文件夹共享到电脑B上。我们首先修改A的IP为192.168.0.1,如下图所示: 同样的方法将电脑B的IP改为:192.168.0.2,修改好后,打开电脑A或者电脑B中的网络,就可以看点两台电脑的主机名,如下图所示: ...

2018-03-01 14:10:16 12697 2

原创 tensorflow中while_loop()

函数原型tf.while_loop(cond, body, loop_vars, shape_invariants=None, parallel_iterations=10, back_prop=True, swap_memory=False, name=None)其中,cond返回一个布尔型张量,body是循环体,loop_vars是运...

2018-02-28 17:03:55 6712

原创 python中Queue模块

创建队列python中Queue模块提供了3中队列: 1. Queue.Queue(maxsize):先进先出队列(最常用) 2. Queue.Lifoqueue(maxsize):先进后出队列 3. Queue.Priorityqueue(maxsize):优先级队列(优先级越低越先出)这里只介绍最常用的现进先出队列import Queueq = Queue.Queue(...

2018-02-24 17:39:46 1765 2

原创 python中利用ConfigParser模块读取配置文件

配置文件配置文件一般用于保存一些代码运行所需要的参数信息,如.cfg文件,一个具体配置文件内容如下:[Common]image_size: 448batch_size: 16num_classes: 20max_objects_per_image: 20[DataSet]name: yolo.dataset.text_dataset.TextDataSetpath: data

2018-02-07 19:44:21 1307

原创 目标定位和检测系列(1):一些基本概念

最近开始学习深度学习中的定位和检测任务。本来打算直接看论文,却发现文章中的的很多基本概念都搞不清楚,于是就自己先梳理了一些定位和检测任务的基本概念。(内容主要来自斯坦福大学的CS231课程、吴恩达的deeplearning.ai卷积部分,这两门课程都可以在网易云课堂里找到汉化版)识别、定位、检测和分割识别和定位:针对单个目标的任务,识别就是给定一张图片,要让计算机告诉你图片中是什么。而

2018-01-23 16:16:48 11898

翻译 一份快速完整的Tensorflow模型保存和恢复教程(译)

原文链接A quick complete tutorial to save and restore Tensorflow models–by ANKIT SACHAN (英文水平有限,有翻译不当的地方请见谅)在本教程中,我将介绍: - tensorflow模型是什么样子的? - 如何保存一个Tensorflow模型? - 如何恢复一个Tensorflow模型用于预测/迁移学习?

2018-01-07 20:56:14 16469 20

原创 Tensorflow中创建自己的TFRecord格式数据集

参考文献《TensorFlow实战Google深度学习框架》TFRecord格式介绍TFRecord文件中的数据都是通过tf.train.Example Protocol Buffer格式(即二进制文件)存储,具体定义如下:message Example{ Features features = 1;};message Features{ map<string,Feature>

2018-01-03 22:03:41 5821 3

原创 论文笔记:Deep Residual Network

越深的网络越难训练。我们提供了一个残差学习框架来简化网络训练过程,这个网络比之前所用的网络要深得多。该网络能够根据输入学习残差函数而不是原始函数。本文提供了全面的实例来表明这些残差网络更容易优化并且可以从更深的网络中获得更高的准确率。

2018-01-02 15:20:01 2492

原创 C++中的模板类vector

vector是一种动态数组,可以在运行程序时设置vector对象的长度,可以动态地进行删除、添加等操作,可以像访问数组一样用[]来访问某一个元素。在使用vector时,需要包含头文件<vector><vector>。

2017-11-21 21:25:43 1028 1

原创 Opencv笔记:利用霍夫变换检测图像中的红球

代码功能为从一副图像中检测红球,当然也可以针对视频的单帧图像进行检测,关于霍夫圆变换HouCircles()函数及其原理主要参考了《opencv3编程入门》

2017-10-21 14:44:36 3350

原创 从2014年到2017年——我的数模经历

白天刚结束了今年的研究生数模,想到这可能是我最后一次参加数模了,还是挺有感触的。故把本人四年建模的一些所思所想记录在这里。

2017-09-21 01:19:38 5315 1

原创 论文笔记:Batch Normalization

论文原文链接:https://arxiv.org/abs/1502.03167深度神经网络训练过程中前面层参数的变化会导致每一层输入分布发生改变,这使得网络训练变得复杂。这个问题还使得网络需要以较低的学习率和仔细的参数初始化,从而降低了训练速度,同时当采用饱和非线性激活函数时网络训练变得异常复杂。我们将这种现象叫做internal convariate shift,并且通过标准化每一

2017-09-05 21:07:14 958

原创 Python中文件的读取和写入

Python中文件的读取和写入

2017-08-18 23:42:55 207020 6

原创 利用Caffe创建自己的lmdb数据集

用Caffe进行模型训练时,除了用现有的公开数据集(如MNIST, CIFAR等),有时候我们还需要创建自己的数据集进行训练。本篇博客讲的就是如何利用Caffe中的模块创建自己lmdb数据集。

2017-08-11 18:03:29 9707 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除