自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

LeoLee

纸上得来终觉浅，绝知此事要躬行

原创《小目标目标检测的解决方法及方式》

《小目标目标检测的解决方法及方式》最近在做小目标相关的项目，参考了一些博客、论文及书籍，在这里对小目标的方法和方式做了些总结。如果有哪些问题理解错误或补充欢迎讨论。1.什么是小目标检测在物体检测的各种实际应用场景中，为满足需求，我们通常希望检测出不同大小的物体。多尺度也是物体检测与图像分类两个任务的一大区别。分类问题通常针对同一种尺度，如ImageNet中的224*224大小；而物体检测中，模型需要对不同尺度的物体都能检测出来，这要求模型对于尺度要具有鲁棒性。在多尺度的物体中，大尺度的物体由于面积大、

2020-11-27 10:07:49 13060 1

原创物体检测之损失函数：标准交叉熵损失、平衡交叉熵损失、 Focal Loss

1.标准交叉熵损失标准的交叉熵（Cross Entropy，CE）函数，其形式如下所示。公式中，p代表样本在该类别的预测概率，y代表样本标签。可以看出，当标签为1时，p越接近1，则损失越小；标签为0时p越接近0，则损失越小，符合优化的方向。标准的交叉熵中所有样本的权重都是相同的，因此如果正、负样本不均衡，大量简单的负样本会占据主导地位，少量的难样本与正样本会起不到作用，导致精度变差。为...

2020-04-30 16:34:07 6763

原创物体检测之非极大值抑制：NMS、softNMS、softerNMS、IoU-Net

当前的物体检测算法为了保证召回率，对于同一个真实物体往往会有多个的候选框输出。由于多余的候选框会影响检测精度，因此需要利用NMS过滤掉重叠的候选框，得到最佳的预测输出。当前有如下几种较为常见的NMS方法，1.基本NMS非极大值抑制，顾名思义就是抑制不是极大值的边框，这里的抑制通常是直接去掉冗余的边框。这个过程涉及以下两个量化指标：1.预测得分：NMS假设一个边框的预测得分越高，这个框...

2020-04-28 15:17:14 1597

原创轻量化网络-squeezeNet、MobileNet、ShuffleNet

对于轻量化的网络设计，目前较为流行的有SqueezeNet、 MobileNet、ShuffleNet等结构。其中，SqueezeNet采用压缩再扩展的结构，MobileNet使用了效率更高的深度可分离卷积，而ShuffleNet提出了通道混洗的操作，从而进一步降低了模型的计算量。SqueezeNet...

2020-04-27 15:07:27 2251

转载 Python数据存储：pickle模块的使用讲解

机器学习中，我们常常需要把训练好的模型存储起来，这样在进行决策时直接将模型读出，而不需要重新训练模型，这样就大大节约了时间。Python提供的 pickle模块就很好地解决了这个问题，它可以序列化对象并保存到磁盘中，并在需要的时候读取出来，任何对象都可以执行序列化操作。Pickle模块中最常用的函数为：（1）pickle.dump(obj, file, [,protocol])...

2019-11-15 11:30:28 325

转载 Opencv.VideoWriter()函数

import numpy as npimport cv2cap = cv2.VideoCapture(0)//定义视频编码器//这里有必要提一下fourcc//FourCC全称Four-Character Codes，代表四字符代码 (four character code), 它是一个32位的标示符，其实就是typedef unsigned int FOURCC;是一种独立标示视...

2019-10-08 20:51:58 3226

原创 Python 返回目录os.getcwd()函数用法

os.getcwd()函数：返回当前进程的工作目录。import os, sys# 切换到 "/var/www/html" 目录os.chdir("/var/www/html" )# 打印当前目录print ("当前工作目录 : %s" % os.getcwd())# 打开 "/tmp"fd = os.open( "/tmp", os.O_RDONLY )# 使用 os...

2019-10-08 20:11:53 603

原创 python路径拼接os.path.join()函数的用法

os.path.join()函数：连接两个或更多的路径名组件1.如果各组件名首字母不包含’/’，则函数会自动加上demo1import osPath1 = 'home'Path2 = 'develop'Path3 = 'code'Path10 = Path1 + Path2 + Path3Path20 = os.path.join(Path1,Path2,Path3)...

2019-10-08 19:50:15 12403

原创百度深度学习工程师认证（已通过）

考试时间：2019.8.24本人图像处理与模式识别专业，有一定的基础。10多天之后参加百度深度学习工程师认证，记录中考试参考资源：https://ai.baidu.com/paddlepaddle/openCourses（个人感觉讲的不是很好，有点无趣（背书），最好是结合博客及相关文献进行了解）第一天：机器学习入门第1章监督学习与非监督学习简介第2章...

2019-08-10 18:50:23 8440 12

转载 SIFT算法

SIFT算法简介 SIFT算子是一种图像的局部描述子，具有尺度、旋转、平移的不变性，而且对光照变化、仿射变换和3维投影变换具有一定的鲁棒性。在Mikolajczyk（在参考文献中有个下载链接，包括了这些论文，0积分）对包括SIFT算子在内的十种局部描述子所做的不变性对比实验中，SIFT及其扩展算法已被证实在同类描述子中具有最强的健壮性。 SIFT算法的主要思想是在尺度空间寻找极值...

2019-07-27 10:53:51 362

原创车牌识别系统设计总结

车牌识别系统本次项目的主要流程分为如下几步：1.图像预处理2.车牌定位3.车牌定位4.字符分割5.字符识别车牌识别系统实现流程图如下图所示：车牌识别系统步骤：1.图像预处理输入原始图像：图像预处理流程图： ...

2019-07-19 11:30:24 8739 3

原创 SVＭ（支持向量机）算法介绍

最近正好有时间将SVM的推导整理一遍，借此文章记录自己的学习过程，在本文中借鉴了T老师的讲义和一些博文，以及李航的统计学习方法，若有不足之处，望海涵。SVMsvm算法通俗的理解在二维上，就是找一分割线把两类分开，问题是如下图三条线都可以把红色点和黄色点分开，但哪条线是最优的呢？如果数据本身比较难分怎么办？这都是我们要考虑的问题。决策边界：选出离样本点最远的线段。...

2019-06-25 14:57:11 1099

原创项目总结：人脸识别签到系统

人脸识别签到系统项目总结第一部分：项目简介实验室人脸识别签到系统第二部分：项目系统架构设计2.1业务架构2.2 技术架构基础设施：主要是GPU，基于CUDA的开发学习框架：主要是Dlib Opencv Tensorflow算法模型：主要是人脸区域检测的算法模型，人脸特征点检测算法模型，人脸对齐算法模型，以及活体检测的算法模型视觉技术：主要有实时视频...

2019-06-24 16:40:01 12920 4

转载图像旋转的原理与实现

图像旋转的原理与实现图像旋转的原理与实现一般图像的旋转是以图像的中心为原点，旋转一定的角度，也就是将图像上的所有像素都旋转一个相同的角度。旋转后图像的的大小一般会改变，即可以把转出显示区域的图像截去，或者扩大图像范围来显示所有的图像。图像的旋转变换也可以用矩阵变换来表示。设点逆时针旋转角后的对应点为。那么，旋转前后点、的坐标分别是：(...

2019-06-17 12:00:28 7575

转载精确率和召回率

实际上非常简单，精确率是针对我们预测结果而言的，它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了，一种就是把正类预测为正类(TP)，另一种就是把负类预测为正类(FP)，也就是而召回率是针对我们原来的样本而言的，它表示的是样本中的正例有多少被预测正确了。那也有两种可能，一种是把原来的正类预测成正类(TP)，另一种就是把原来的正类预测为负类(FN)。其实就是分母不...

2019-06-17 10:16:14 256

原创神经网络中的几种权重初始化方法

神经网络中的几种权重初始化方法在深度学习中，对神经网络的权重进行初始化（weight initialization）对模型的收敛速度和性能的提升有着重要的影响。在神经网络在计算过程中需要对权重参数w不断的迭代更新，已达到较好的性能效果。但在训练的过程中，会遇到梯度消失和梯度爆炸等现象。因此，一个好的初始化权重能够对这两个问题有很好的帮助，并且，初始化权重能够有利于模型性能的提升，以及增快收...

2019-06-14 13:29:28 5728

原创 Object Detection网络框架学习:SSD

SSD(Single Shot MultiBox Detector)是ECCV2016的一篇文章，属于one - stage套路。在保证了精度的同时，又提高了检测速度，相比当时的Yolo和Faster R-CNN是最好的目标检测算法了，可以达到实时检测的要求。在Titan X上，SSD在VOC2007数据集上的mAP值为74.3%，检测速度为59fps。SSDSSD效果为什么这么好...

2019-05-26 14:07:07 258

原创 GitHub：目标检测最全论文集锦

https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html

2019-05-24 10:48:29 445

原创 Object Detection网络框架学习:YOLOV1

YOLO V1是继 RCNN，fast-RCNN 和 faster-RCNN之后，Ross Girshick 针对 DL 目标检测速度问题提出的另外一种框架。YOLO V1 其增强版本在 GPU 上能跑45fps，简化版本155fps。YOLO1.YOLO 的核心思想 YOLO 的核心思想就是利用整张图作为网络的输入，直接在输出层回归 bounding box（边界框） ...

2019-05-20 21:16:24 311

原创 Object Detection网络框架学习:Faster-RCNN

经过RCNN和Fast RCNN的积淀，Ross B. Girshick在2016年提出了新的Faster RCNN，在结构上，Faster RCN已经将特征抽取(feature extraction)，proposal提取，bounding box regression(rect refine)，classification都整合在了一个网络中，使得综合性能有较大提高，在检测速度方面尤为明显。...

2019-05-15 11:41:39 404

原创 Object Detection网络框架学习:Fast-RCNN

2014年R-CNN横空出世，首次将卷积神经网络带入目标检测领域。受SPPnet启发，rbg在15年发表Fast R-CNN，它的构思精巧，流程更为紧凑，大幅提高目标检测速度。在同样的最大规模网络上，Fast R-CNN和R-CNN相比，训练时间从84小时减少为9.5小时，测试时间从47秒减少为0.32秒。在PASCAL VOC 2007上的准确率相差无几，约在66%-67%之间。Fast...

2019-05-14 15:47:14 244

原创 CNN网络架构学习：Chapter-6-DenseNet(附代码tensorflow)

CVPR2017年的Best Paper, DenseNet脱离了加深网络层数(ResNet)和加宽网络结构(Inception)来提升网络性能的定式思维,从特征的角度考虑,通过特征重用和旁路(Bypass)设置,既大幅度减少了网络的参数量,又在一定程度上缓解了gradient vanishing问题的产生.结合信息流和特征复用的假设,DenseNet当之无愧成为2017年计算机视觉顶会的年度最佳...

2019-05-13 11:28:07 878

原创 CNN网络架构学习：Chapter-5-ResNet(附代码tensorflow)

ResNet（Residual Neural Network）由微软研究院的Kaiming He等人提出，通过使用ResNet Unit成功训练出了152层的神经网络，并在ILSVRC2015比赛中取得冠军，ResNet在网络结构上做了大创新，而不再是简单的堆积层数，ResNet在卷积神经网络的新思路，绝对是深度学习发展历程上里程碑式的事件。ResNet闪光点：层...

2019-05-12 18:30:39 1468

原创 Object Detection网络框架学习:SPPNet

SPPNetSPP-Net是一种可以不用考虑图像大小，输出图像固定长度网络结构，并且可以做到在图像变形情况下表现稳定。SSP-net的效果已经在不同的数据集上面得到验证，速度上比R-CNN快24-102倍。在ImageNet 2014的比赛中，此方法检测中第二，分类中第三。SPPNet经典论文《Spatial Pyramid Pooling in Deep ConvolutionalNet...

2019-05-12 15:38:04 266

原创 CNN网络架构学习：Chapter-4-GoogleNet(附代码tensorflow)

GoogLeNet在2014的ImageNet分类任务上击败了VGG-Nets以较大的优势获得冠军。GoogLeNet跟AlexNet,VGG-Nets这种单纯依靠加深网络结构进而改进网络性能的思路不一样，它在加深网络的同时（22层），也在网络结构上做了创新，引入Inception结构代替了单纯的卷积+激活的传统操作（这思路最早由Network in Network提出）。GoogLeNet进一步...

2019-05-12 13:05:23 735 1

转载 CNN学习-CNN图像尺寸输入限制问题

通过CNN组成（卷积层和全连接层）进行分析。（1）卷积层卷积层对于图像是没有尺寸限制要求的。输入图像是28*28，卷积仅于自身的卷积核大小，维度有关，输入向量大小对其无影响（如第一层卷积，输入图像的大小和维度）。# 输入图像x = tf.placeholder(tf.float32, [None, 784])y_ = tf.placeholder(tf.float32, [None...

2019-05-11 11:42:10 5739

原创 Object Detection网络框架学习:R-CNN

R-CNNR-CNN的全称是Region-CNN，是第一个成功将深度学习应用到目标检测上的算法。R-CNN基于卷积神经网络(CNN)，线性回归，和支持向量机(SVM)等算法，实现目标检测技术。R-CNN经典论文《Rich feature hierarchies for Accurate Object Detection and Segmentation》。Ross Girshick这篇p...

2019-05-11 11:38:56 325

原创 CNN网络架构学习：Chapter-3-VGGNet(附代码tensorflow)

VGG-Nets是由牛津大学计算机视觉组(Visual Geometry Group)和Google Deepmind公司研究员一起研发的深度卷积神经网络，是2014年ImageNet竞赛定位任务的第一名和分类任务的第二名的中的基础网络。VGG可以看成是加深版本的AlexNet. 都是conv layer + FC layer，层数高达十多层，当然以现在的目光看来VGG真的称不上是一个very d...

2019-05-11 09:50:58 805

原创 Object Detection网络框架学习:Chapter1-物体检测概念

在进行R-cnn的介绍之前，先简单的介绍一下物体检测相关的基础知识：物体检测在传统视觉领域，物体检测是一个非常热门的研究方向。受70年代落后的技术条件和有限应用场景的影响，物体检测直到上个世纪90年代才开始逐渐走入正轨。物体检测对于人眼来说并不困难，通过对图片中不同颜色、纹理、边缘模块的感知很容易定位出目标物体，但计算机面对的是RGB像素矩阵，很难从图像中直接得到狗和猫这样的抽象概念并定位...

2019-05-10 15:51:52 205

转载 CNN学习-Dropput

1. Dropout简介1.1 Dropout出现的原因在机器学习的模型中，如果模型的参数太多，而训练样本又太少，训练出来的模型很容易产生过拟合的现象。在训练神经网络的时候经常会遇到过拟合的问题，过拟合具体表现在：模型在训练数据上损失函数较小，预测准确率较高；但是在测试数据上损失函数比较大，预测准确率较低。过拟合是很多机器学习的通病。如果模型过拟合，那么得到的模型几乎不能用。为了解决过拟合...

2019-05-10 14:54:39 2271

原创 CNN网络架构学习：Chapter-2-AlexNet(附代码tensorflow)

2012年，Hinton的学生Alex提出了CNN模型AlexNet，AlexNet可以算是LeNet的一种更深更宽的版本。同年AlexNet以显著优势获得了IamgeNet的冠军,top-5错误率降低到了16.4%，相比于第二名26.2%的错误路有了巨大的提升，而AlexNet模型的参数量还不到第二名模型的二分之一。AlexNet可以说是神经网络在低谷期后第一次发威,确立了深度学习在计算机视觉领...

2019-05-10 14:50:10 563

转载 CNN学习-全连接（fc）

全连接层的推导全连接层的每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起来。由于其全相连的特性，一般全连接层的参数也是最多的。全连接层的前向计算下图中连线最密集的2个地方就是全连接层，这很明显的可以看出全连接层的参数的确很多。在前向计算过程，也就是一个线性的加权求和的过程，全连接层的每一个输出都可以看成前一层的每一个结点乘以一个权重系数W，最后加上一个偏置值b得到，即 ...

2019-05-09 15:51:40 5223 1

原创 CNN网络架构学习：Chapter-1-LetNet(附代码tensorflow)

卷积神经网络可谓是现在深度学习领域中大红大紫的网络框架，尤其在计算机视觉领域更是一枝独秀。CNN从90年代的LeNet开始，21世纪初沉寂了10年，直到12年AlexNet开始又再焕发第二春，从ZF Net到VGG，GoogLeNet再到ResNet和最近的DenseNet，网络越来越深，架构越来越复杂，解决反向传播时梯度消失的方法也越来越巧妙。本文将会谈到以下经典的卷积神经网络-LetNet....

2019-05-09 11:24:44 950

转载【深度学习】批归一化（Batch Normalization）

BN是由Google于2015年提出，这是一个深度神经网络训练的技巧，它不仅可以加快了模型的收敛速度，而且更重要的是在一定程度缓解了深层网络中“梯度弥散”的问题，从而使得训练深层网络模型更加容易和稳定。所以目前BN已经成为几乎所有卷积神经网络的标配技巧了。从字面意思看来Batch Normalization（简称BN）就是对每一批数据进行归一化，确实如此，对于训练中某一个batch的数据{x1...

2019-05-01 15:32:26 1122

转载机器学习笔记：为什么要对数据进行归一化处理？

文章来自知乎，作者hit nlper忆臻转自：https://zhuanlan.zhihu.com/p/27627299在喂给机器学习模型的数据中，对数据要进行归一化的处理。为什么要进行归一化处理，下面从寻找最优解这个角度给出自己的看法。例子假定为预测房价的例子，自变量为面积，房间数两个，因变量为房价。那么可以得到的公式为：其中代表房间数，代表变量前面的系数。...

2019-05-01 15:30:17 1760

原创 “如何翻转栈的所有元素”(python)

题目描述：翻转栈中的所有元素，例如输入栈{1，2，3，4，5}，其中，1处在栈顶，翻转之后的栈为{5，4，3，2，1}其中，5在栈顶。方法一：最容易想到的方法就申请额外的一个队列，先把栈中的元素依次出栈放到队列里，然后把队列里的元素按照出队列顺序入栈，然这样就可以实现栈的翻转。方法二：递归法递归程序有两个关键的因素需要注意: 递归定义和递归的终止条件。递归定义：将当前栈的最...

2019-04-27 19:14:49 1083

转载【学习笔记】Selective Search算法--Selective Search for Object Recognition

1. 介绍如果想在一张图像上找到我们想要的目标(比如猫), 处理的流程一般分成两步: 第一步: 先找出可能的候选regions(有很多方法); 第二步: 从这些regions里面找出来一个region, 这个region把目标包含在内(提取特征, 然后分类). 本文所提出的selective search(下面简称SS)方法就是在第一步上(找到最可能的候选regions)上下功夫。常用的R...

2019-04-25 21:12:39 413

原创 tensorflow:模型的保存与恢复

将训练好的模型参数保存起来，以便验证或测试，这是我们在训练过程中经常做的事情。tf里面提供模型保存的代码是tf.train.Saver()。模型保存，先要创建一个Saver对象：如saver=tf.train.Saver()在创建Saver对象时，我们经常会使用 max_to_keep 参数，这个参数的作用是用来设置保存模型的个数，默认为5max_to_keep=5既保存最近的...

2019-04-15 12:49:41 154

原创 "快速排序"(python)

快速排序是一种非常高效的排序算法，它采用分而治之的思想，把大的拆分成小的，小的拆分成更小的。其原理是：对于一组给定的记录，通过一趟排序后，将原有序列分为两个部分，其中前部分的所有记录均比后部分的所有记录要小，然后再依次对前后两部分进行快速排序，递归该过程，直到序列中的所有记录均有序为止。def quick_sort(lists, left, right): # 快速排序 i...

2019-04-11 19:01:21 164

原创 “归并排序”（python）

归并排序就是利用递归和分治技术将数据序列分成为越来越小的半子表，再对半子表排序，最后再用递归步骤将排好序的半子表和并成为越来越大的有序序列。其中“归”代表递归的意思，既递归地将数组折半地分离为单个数组。def merge(left, right): # 合并 i, j = 0, 0 result = [] while i < len(left) and j &...

2019-04-10 19:25:27 142

2017-cvpr-《Interspecies Knowledge Transfer for Facial Keypoint Detection》数据集

2017-cvpr-《Interspecies Knowledge Transfer for Facial Keypoint Detection》数据集

2020-06-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除