周智强-CSDN博客

原创目标分割开源软件Labelme的使用

1.打开anaconda下面的Anaconda prompt2.输入labelme在这里插入图片描述Labelme打开了在这里插入图片描述4.点创建多边形在这里插入图片描述5.然后就描边，最后双击结束在这里插入图片描述6.点save，然后json就保存下来了在这里插入图片描述7.最后ship图片和json分别放在两个文件夹中，名字都一样，一一对应...

2020-11-09 10:39:49 198

原创目标检测开源软件LabelImg的使用

1.准备数据集，下载labellmg，地址：https://github.com/tzutalin/labellmg2、点击Open Dir可以打开文件夹，文件夹中的图片就会载入进来3、选好图片标注好了之后标签文件存放路径4、点击 Create\nRectBox将需要标注的部分框起来，然后选择标签(没有的标签可以自己添加)在软件的右上角出现了选择的标签5、点击左边的Save，将...

2019-11-12 12:02:47 758

原创 Non-max suppression非极大值抑制(NMS)

一个物体可能会被几个候选框框中，如下图，蓝色、红色、黄色的框，它们都是正确的结果，NMS的作用就是帮助减少候选框的数量，得到置信度最高，框中的效果最好的候选框。选出置信度最高的候选框，如果和当前最高分的候选框重叠面积loU大于一定阈值，就将其删除。下图中红色框的置信度最高，其认为有90%的概率框中的是猫。保留红色的框，抑制掉它旁边Iou大于一定阈值的其他框。当存在多预测目标时，先选取置信...

2019-11-10 14:45:52 612

原创交并比、mAP

判断目标检测结果好坏的指标交并比loU（intersection-over-union）交并比就是两个框的交集除以并集蓝色框是Detection Result，红色框是Ground Truth。一般来说一般可以设置loU的阈值大于等于0.5比如把loU阈值设置为0.5，则可以认为与Ground Truth的loU大于等于0.5的Detection Result是正样本。则与Ground...

2019-11-10 14:32:21 588

原创空洞卷积、转置卷积

Atrous Convolution 空洞卷积空洞卷积（atrous convolutions）又名扩张卷积（dilated convolutions），向卷积层引入了一个称为“扩张率（dilation rate）"的新参数，该参数定义了卷积核处理数据时各值的间距。空洞卷积提供了更大的感受野。在相同感受野的情况下，使用空洞卷积可以得到更大的特征图，可以获得更加密集（Dense）的数据。举例...

2019-11-10 12:38:36 678

原创 Mask R-CNN笔记

Mask R-CNN是一个实例分割（Instance segmentation）算法，可以用来做目标检测，目标实例分割，目标关键点检测。实例分割的难度在于要先对一张图所有的目标进行正确的检测同时还要对每个实例进行分割。检测的目的是把每一个单个目标分类然后用bounding box标定出来，而实例分割的目的是区分每一个像素为不同的分类。Mask R-CNN介绍整个Mask R-CNN算法的...

2019-11-08 18:22:20 334

Berkeley团队于2014年提出Fully Convolutional Networks（FCN）方法用于图像语义分割，将图像级别的分类扩展到像素级别的分类。FCN可以接受任意尺寸的输入图像，采用转置卷积层对最后一个卷积层的feature map进行上采样，使它恢复到输入图像相同的尺寸，从而可以对每个像素都产生了一个预测，同时保留了原始输入图像中的空间信息，最后在上采样的特征图上进行逐像素分...

2019-11-08 15:29:15 2050

原创语义分割评价方式

图像分割中通常使用许多标准来衡量算法的精度。这些标准通常是像素精度及loU的变种，以下我们将会介绍常用的几种逐像素标记的精度标准。为了便于解释，假设如下：共有k+1个类（从L0L_0L0到LkL_kLk，其中包含一个空类或背景），pijp_{ij}pij表示本属于类i但被预测为类j的像素数量。piip_{ii}pii表示识别正确的样本数量，而pijp_{ij}pij和pjip_{ji}p...

2019-11-08 14:13:57 836 1

原创 YOLO-V1 笔记

confidence置信度其中前一项表示有无人工标记的物体落入了网格内，如果有则为1，否则为0。第二项代表bounding box和真实标记的box之间的IOU。值越大则box越接近真实位置。confidence是针对bounding box的，每个网格有两个bounding box，所以每个网络会有两个confidence与之对应。1.一张图片会被分成7*7=49个格子区域，每一个格子得...

2019-11-07 15:21:55 260

原创 SSD笔记

SSD(single shot multibox detector)SSD模型结构SSD算法是2016年推出的一种目标检测模型，算法的主网络结构是VGG16。s2表示步长是238x38、19x19、10x10、5x5、3x3、1x1的特征图...

2019-11-07 14:49:08 393

原创 Faster-RCNN笔记

Faster-RCNN是RBG团队在2015年的又一力作。简单网络目标检测速度达到17fps，复杂网络达到5fps。Fast-RCNN已经很优秀了，但是还存在一个比较大的问题，就是selective search。selective search算法只能运行在CPU上，限制了速度。Faster-RCNN加入了一个专门生成候选区域的神经网络，也就是说找到候选框的工作也交给了神经网络来做了。做这个...

2019-10-28 14:56:49 675

原创 Fast-RCNN笔记

Fast-RCNN继2014年的RCNN之后，作者借鉴了SPP-Net的设计思想，在15年推出了Fast RCNN。卷积只要做1次获得特征图，将ss算法生成的2000个候选区域映射到特征图上再做ROI pooling(类似金字塔池化），变成相同维度的数据，再用得到的数据训练回归器和分类器ROI Pooling(Region of Interest Pooling)roi pooling...

2019-10-27 17:05:39 233

原创 SPP-Net笔记

SPP-Net(Spatial Pyramid Pooling Net)RCNN的进化中SPP Net的思想对其贡献很大，这里也简单介绍一下SPP-Net。SPP-Net的作者是何凯明。R-CNN的最大瓶颈是2k个候选区域都要经过一次CNN，速度非常慢。SPP-net最大的改进是只需要将原图做一次卷积操作，就可以得到每个候选区域的特征。上图中的第1行是RCNN,第2行是SPP-NetSP...

2019-10-27 16:12:39 151

原创 RCNN笔记

RCNN（Regions with CNN features）是RBG在2014年提出的一种目标检测算法，RCNN是将CNN方法应用到目标检测问题上的一个里程碑，借助CNN良好的特征提取和分类性能，通过Region Proposal方法实现目标检测。滑动窗口法可以得到目标所在的区域，但是会产生大量的计算。除了滑动窗口法之外还有另外一类基于区域（Region Proposal）的方法，select...

2019-10-27 14:57:27 127

原创 YOLO-V3笔记

YOLO-V3模型结构YOLOv3于2018年推出，基础框架为Darknet-53还是很多卷积层的叠加，有特点的地方是使用了残差模块第1个框内的部分重复1次，第2个框内的部分重复2次，第3个框内的部分重复8次等等。网络的总层数是53参考了SSD的做法，采用不同尺度的多个特征图的特征来获取这个预测框。用到了3个尺度的特征，不同尺度的特征也是能够检测不同大小的物体。Scale1检测大的物体，S...

2019-10-27 11:42:24 265

原创 YOLO-V2笔记

YOLO-V2速度优化针对YOLO准确率不高，容易漏检，对长宽比不常见物体效果差等问题，结合SSD的特点，2016提出了YOLO-V2。为了精度与速度并重，作者在速度上也作了一些改进措施。大多数检测网络依赖于VGG-16作为特征提取网络，VGG-16是一个强大而准确的分类网络，但是确过于复杂。224224的图片进行一次前向传播，其卷积层就需要多达306.9亿次浮点数运算。YOLO使用的是基...

2019-10-27 10:24:23 229

原创 FaceNet论文要点回顾

FaceNet的Key features有哪些？端对端，没有3D modeling,alignment 的步骤通过FaceNet就能获得每张image的Embedding Vector，拿到Embedding Vector后加一个阈值(Thresholding value)就能做人脸验证(verification)任务加KNN就能做人脸识别(recognition)任务加K-means就...

2019-04-25 13:41:54 332

原创 TensorFlow学习笔记2:pb文件的保存和加载方法

pb文件的保存方法使用 tf.train.Saver 会保存运行 TensorFlow 程序所需要的全部信息，然而有时并不需要某些信息。比如在测试或者离线预测时，只需要知道如何从神经网络的输入层经过前向传播计算得到输出层即可，而不需要类似于变量初始化、模型保存等辅助节点的信息。而且，将变量取值和计算图结构分成不同的文件存储有时候也不方便，于是 TensorFlow 提供了 convert_var...

2019-04-15 12:35:08 2986 2

原创训练深度学习模型时让Python脚本在后台运行

背景：在云服务器上训练我自己的深度学习模型，在终端中直接运行程序的时候断开终端，或者在Jupyter Notebook里面运行程序的时候关掉Jupyter的网页，都会导致进程直接被杀死。如果想要关掉终端或者网页，需要将训练任务转为后台运行。setsid python filename.py > /tmp/log1 2>&1 &实现的功能：让程序后台运行，并将屏幕输...

2019-04-14 17:42:26 2377

原创训练自己的目标检测程序

链接：https://pan.baidu.com/s/1ski-qC9Br2O44TMct52KxA提取码：jqiw训练自己的目标检测程序准备数据集，做好标注可以用标注软件labelImgxml转换到csv用xml_to_csv.py其中程序中的xml_df = xml_to_csv(image_path)image_path为xml目录路径，生成的csv文件默认保存在程序目录下。...

2019-04-02 14:12:09 571

翻译在Ubuntu上安装Docker CE

原文链接:https://docs.docker.com/install/linux/docker-ce/ubuntu/在Ubuntu上安装Docker CEGet Docker CE for Ubuntu先决条件(Prerequisites)Docker EE 用户OS requirementsUninstall old versionsSupported storage driversIns...

2019-04-01 18:21:41 2887

原创 FaceNet论文翻译学习4

原文链接:FaceNet: A Unified Embedding for Face Recognition and ClusteringFaceNet6. 总结(Summary)7. 附录：谐波嵌入(Appendix: Harmonic Embedding)7.1. 谐波三元组损失(Harmonic Triplet Loss)7.2. 总结(Summary)致谢(Acknowledgments...

2019-03-24 12:55:02 1151

原创 FaceNet论文翻译学习3

4. 数据集和评估(Datasets and Evaluation)We evaluate our method on four datasets and with the exception of Labelled Faces in the Wild and YouTube Faces we evaluate our method on the face verification task. ...

2019-03-23 15:06:20 830

原创 FaceNet论文翻译学习2

三元组损失应该要满足下面的式子，f(xia)f(x_{i}^a)f(xia)表示anchor图的特征向量，f(xip)f(x_{i}^p)f(xip)表示positive的图片的特征向量，f(xin)f(x_{i}^n)f(xin)表示negative的图片的特征向量，α\alphaα表示人为设置的参数。∥f(xia)−f(xip)∥22{\|f(x_{i}^a)-f(x_{i}^p)\|...

2019-03-19 14:06:03 1089

原创 FaceNet论文翻译学习1

原文链接:FaceNet: A Unified Embedding for Face Recognition and ClusteringFaceNet摘要(Abstract)1. 介绍(Introduction)摘要(Abstract)Despite significant recent advances in the field of face recognition [10, 14, ...

2019-03-18 18:26:33 1396

翻译 Kaggle的入门指南

原文链接：https://elitedatascience.com/beginner-kaggleKaggle的入门指南如何开始使用Kaggle第1步：选择一种编程语言。第2步：了解探索数据的基础知识。第3步：训练您的第一个机器学习模型。第4步：解决“入门”比赛。第5步：争取最大化学习，而不是收入。享受Kaggle的小贴士提示＃1：设置增量目标。提示＃2：查看大多数投票kernels。提示＃3：...

2019-01-22 21:41:27 731

weixin_42510957的博客