Yolo_1996-CSDN博客

转载一文深入学习什么是感受野

1.先举个例子：e.g.两层 33 卷积操作的有效区域(感受野)是5∗55*55∗5 (所有filter的stride=1,pad=0),示意图如下三层3∗33*33∗3卷积核操作的有效区域是77 (所有filter的stride=1，pad=0),示意图如下：2. 基本定义：定义：感受野用来表示网络内部的不同神经元对原图像的感受范围的大小，或者说，convNets(cnn)每一层输出...

2019-01-23 10:54:22 5600

转载巡礼卷积神经网络中的那些经典结构（二）——inception module

这篇文章向大家介绍一下inception module这个结构，在本文中我们只对inception module进行介绍，inception v1——v4系列文章会在后续文章中推出，请大家期待。本文转载自磐创AI一、Inception网络简介Inception网络又叫做GoogLeNet,之所以不叫GoogleNet，是为了向LeNet致敬,是2014年ChristianSzegedy在《...

2018-12-26 12:39:19 3909 1

原创巡礼卷积神经网络中的那些经典结构（一）—— Group convolution

笔者在阅读论文的过程中，发现论文中经常会涉及到一些经典的神经网络结构，尽管这些结构可能出现的时间，但是生生不息，经历住了时间的考验。在这个系列文章中，我将对那些经典的网络分别做一个简单介绍。作为这个系列文章的第一篇文章，本文首先要介绍的是 Group convolution这个结构。Group Convolution简介Group Convolution，即分组卷积（也被译为群卷积），是...

2018-12-25 23:04:59 1199

本文转载自《机器之心》，原文链接：https://mp.weixin.qq.com/s/QuDa__mi1NX1wOxo5Ki94A ，如有侵权请联系删除。很显然，深度学习即将对我们的社会产生重大显著的影响。Mobibit 创始人兼 CEO Pramod Chandrayan 近日在 codeburst.io 上发文对自动编码器的基础知识和类型进行了介绍并给出了代码实例。机器之心对本文进行了...

2018-12-21 14:37:34 5122

原创调用objection detection API 实现目标检测

之前我其实已经介绍过调用这个objection实现目标检测的方法，安装上次的那个教程我们可以调用摄像头实现目标的实时检测，这篇文章则是向大家介绍如何对离线下载好的视频进行检测。一、环境配置环境配置部分和上次基本相同，这里我不再赘述，如果对此有疑问可以参考上一次的教程：手把手教你如何用objection detection API实现实时目标检测（一）手把手教你如何用objection...

2018-12-18 22:59:32 1610

原创机器学习反向传播算法的数学推导

周志华的西瓜书机器学习被誉为是机器学习的入门宝典，但是这本书对于深度学习的知识介绍非常少，仅仅只是在第五章《神经网络》中对其进行简单的概括。这一章对于深度学习的介绍非常浅显，没有很深入的对其中的知识进行挖掘，也没有很复杂的数学推导。博主在这里对反向传播算法进行数学推导，这里我使用的方法和周老师有些不同，或许更方便一些。一、反向传播算法概述误差反向传播算法又称为BP算法，是由Werbos...

2018-12-09 19:42:22 1981

原创周志华西瓜书《机器学习》第三章线性模型

又好像很久更新了，但这几天我都有在学习哦~。一位同学和我说感觉我的笔记很多是对书本原文的再现，缺少自己的思考和重点提炼。我反思了一下好像真的是这样的呢，这样子写似乎的确是和原文没有多大的区别（而且敲那么多字非常的累）。所以从这篇笔记开始我会挑选书中的重点来记录啦，对于个别比较难理解的公式也会单独拿出来推导，不再把时间花在重复劳动上。在写文章方面我只是一个小白，希望大家多多包涵。3.1基本...

2018-12-09 11:10:08 909

原创机器学习——支持向量机SVM（一）

在之前做数学建模的时候就有使用过支持向量机的有关知识，但是对于支持向量机的理解一直不是很深刻，尤其是数学推导部分还是存在一些问题。在最近看周志华西瓜书的过程中同样发现这一问题，西瓜书中对支持向量机的讲解部分不是很详细，所以我又查找了其他的资料。支持向量机是一种原创性（非组合）的具有明显直观几何意义的分类算法，具有较高的准确率。虽然支持向量机的几何意义较为直观，但是细节非常复杂，内容涉及到凸优...

2018-12-08 19:18:34 786

原创周志华西瓜书《机器学习笔记》学习笔记第二章《模型的评估与选择》

本章是西瓜书的第二章，周志华老师在这一部分基础对机器学习中的基础知识进行介绍，主要阐述了误差、过拟合的相关概念和模型的评估度量方法。博主在今年元旦之后就要正式开始做毕业设计了，所以我会努力在今年元旦假期结束之前把西瓜书的所有内容更新。也希望大家可以监督我嘻嘻。一、经验误差与过拟合错误率：分类错误的样本数占样本总数的比例称为“错误率”，即如果我们在mmm个样本中有aaa个样本分类错误，...

2018-12-02 14:59:55 1992

原创 AI研究院巡礼——小米AI研究院

在本系列的文章中，我将对国内一些比较著名的AI研究院进行介绍，资料来源于互联网。一、简介：小米AI研究院的前身是小米探索实验室，在2016年初的小米公司年会上，由雷军宣布小米探索实验室的成立，实验室初期重点投入虚拟现实和智能机器人等新方向，为小米的发展奠定下一个台阶。目前小米的人工智能与云平台部门之下有三大AI部门，分别是AI实验室、AI平台和小爱同学，三者在研发资金、人才和资源配比方面...

2018-12-02 11:20:53 5429

原创周志华西瓜书《机器学习笔记》学习笔记第一章《绪论》

最近在帮学弟做一个关于OCR的项目，所以这几个星期都没有在CSDN上更新文章。今天登录后发现有还几个小伙伴关注我了，很开心~。我会继续在CSDN上更新一些内容，总结自己每个阶段的学习情况。周志华老师的西瓜书堪称学习机器学习的必备书籍，很多学生包括我自己都是从这本书开始接触机器学习。周志华老师将这本书定位一本自学用书和科研参考书，但对于初学者来说，在学这本书的时候肯定有很多不明白的地方。我大概在...

2018-11-30 20:13:28 1038

原创吴恩达深度学习系列课程笔记：卷积神经网络（一）

本系列文章将对吴恩达在网易公开课“深度学习工程师”微专业内容进行笔记总结，这一部分介绍的是“卷积神经网络”部分。1、计算机视觉计算机视觉在我们还是生活中有非常广泛的应用，以下几个是最常见的例子：图像分类：可以对图像中的物体种类进行判断，如确定图像中的物体是否是猫风格迁移将一幅画的风格迁移到另一张图片中，使之以之前那副图的形式来表现这一幅图像的内容。目标检测将一幅画的...

2018-11-13 23:56:57 4024

原创手把手教你如何用objection detection API实现实时目标检测（三）

本文是这一系列文章的最后一篇，由于之前两篇文章已经对项目的环境配置和参数修改做了较为详细的介绍。因此，在本文中我们不再赘述上述部分，读者可以看一下之前的两篇文章。《手把手教你如何用objection detection API实现实时目标检测（一）》、《手把手教你如何用objection detection API实现实时目标检测（二）》。上文我们已经根据训练图片进行模型训练，模型可以对输入...

2018-11-09 01:34:09 2699 1

原创手把手教你如何用objection detection API实现实时目标检测（二）

上文我们介绍如何配置用objection detection API实现实时目标检测的环境(原文链接)，在这里，我们将给大家介绍如何如何自己动手做一个目标检测系统来实现对图像的识别。一、准备图片在这里博主想要实现的是使用API来对手机进行检测，因此我们首先需要从网上下载一定数量的手机图片，将其保存在文件夹中（这里需要注意的是，我们下载的图片都需要为.jpg格式，原因我们会在下文讲到）。二...

2018-11-09 01:04:13 1875 1

原创手把手教你如何用objection detection API实现实时目标检测（一）

本系列文章共分为三篇，包括环境配置、对图像的目标检测和利用摄像头实现实时检测三个部分，本文主要介绍相关的环境配置部分。step1：准备相关文件在这里我们使用的是GPU版本的TensorFlow，因此在此之前我们需要下载所需要的相关资料。主要有如下几部分：CUDA9.0安装包：下载地址cudnn7.0.5安装包：下载地址项目所需文件：GitHub地址Protobuf3.6.0文件：下载...

2018-11-08 21:39:13 2312

原创从零开始学caffe（十）：caffe中snashop的使用

在caffe的训练期间，我们有时候会遇到一些不可控的以外导致训练停止（如停电、设备故障灯），我们就不得不重新开始训练，这对于一些大型项目而言是非常致命的。在这里，我们介绍一些caffe中的snashop。利用snashop我们就可以实现训练的继续进行。在之前我们训练得到的文件中，我们发现有后缀分别为caffemodel和solverstate的两种文件，其中caffemodel我们知道是训练的...

2018-10-29 15:48:02 568

原创从零开始学caffe（九）：在Windows下实现图像识别

本系列文章主要介绍了在win10系统下caffe的安装编译，运用CPU和GPU完成简单的小项目，文章之间具有一定延续性。step1:准备数据集数据集是进行深度学习的第一步，在这里我们从以下五个链接中下载所需要的数据集：animalflowerplanehouseguitar我们在原先的models文件夹下新建文件夹my_models_recognition，用于存放本文在实现图...

2018-10-29 15:25:47 1789 2

原创从零开始学caffe（八）：Caffe在Windows环境下GPU版本的安装

之前我们已经安装过caffe的CPU版本，但是在MNIST手写数字识别中，我们发现caffe的CPU版本运行速度较慢，训练效率不高。因此，在这里我们安装了caffe的GPU版本，并使用GPU版本的caffe同样对手写MNIST数字集进行训练。step1: 安装CUDA首先需要准备好NVIDIA的显卡，然后下载安装CUDA，在这里我安装的是CUDA8.0下载地址。CUDA的安装过程比较简单，...

2018-10-24 23:36:16 906

原创从零开始学caffe（七）：利用GoogleNet实现图像识别

一、准备模型在这里，我们利用已经训练好的Googlenet进行物体图像的识别，进入Googlenet的GitHub地址，进入models文件夹，选择Googlenet点击Googlenet的模型下载地址下载该模型到电脑中。模型结构在这里，我们利用之前讲到的网络模型绘制网站画出Googlenet的结构图如下：在这里，pad就是给图像补零，pad:2就是补两圈零的意思；LRN就...

2018-10-24 21:27:10 6149 7

原创从零开始学caffe（四）：mnist手写数字识别网络结构模型和超参数文件的源代码阅读

下面为网络结构模型%网络结构模型name: "LeNet" #网络的名字"LeNet"layer { #定义一个层 name: "mnist" #层的名字"mnist" type: "Data" #层的类型"Data"，表明数据来源于LevelDB或LMDB。

2018-10-24 16:33:22 734

原创从零开始学caffe（二）：caffe在win10下的安装编译

环境要求操作系统：64位windows10编译环境：Visual Studio 2013 Ultimate版本安装流程文件的下载从GitHub添加链接描述中下载Windows版本的caffe，并进行解压到电脑中。...

2018-10-24 14:41:01 1601

原创从零开始学caffe（一）：caffe的基础知识介绍

caffe是一款广泛流传的深度学习开源框架，由来自加州大学伯克利分校的贾杨清博士在2013年发布，它的核心语言是C++，支持python和matlab接口。既可以在CPU上运行，又可以在GPU上运行。在计算机视觉领域，如图像识别，目标识别，人脸识别，图像风格转换等方面有广泛应用。由于caffe的核心代码是C++,因此如果要修改框架的底层，则需要通过C++来完成。caffe在处理CNN问题中具有得...

2018-10-24 13:13:27 1470

原创从零开始学caffe（六）：如何在win10下利用caffe绘制网络结构

之前两篇文章我们已经介绍了如何在win10中编译pycaffe，在这里，我们将介绍如何在win10下利用caffe绘制神经网络的结构。利用draw_net.py我们可以利用draw_net.py函数来绘制神经网络（需要确保已经按照前两篇文章配置好相关的环境）。draw_net.py共有三个参数，第一个参数为 “”-rankdir TB”。TB表示TOP到BOTTOM，从上到下对神经网路进行绘制...

2018-10-17 19:14:51 580

原创从零开始学caffe（五）：如何在win10系统下编译pycaffe

本文主要介绍了如何在win10系统下编译pycaffe，可以看做是上一篇文章的连续。1、安装anaconda2首先从Anaconda官网地址中下载相应版本的Anaconda2文件，然后按照提示进行安装。如果之前电脑中已经安装了Anaconda3，可以按照这篇文章的介绍来实现在win10中同时安装Anaconda2和Anaconda3。在安装完Anaconda2之后，如果发现在CMD中无法...

2018-10-17 18:02:28 3886 2

原创从零开始学caffe（三）：在win64下利用caffe快速实现MNIST手写数字识别

本文主要是在win64位系统下，编译环境为Visual Studio 2013 Ultimate版本，利用caffe框架来实现mnist手写数字识别，本文所用的相关资源见github1、数据集下载首先需要下载MNIST手写数字集，下载地址：http://yann.lecun.com/exdb/mnist/将下面这四个压缩包下载到电脑中并进行解压（数据集分为训练数据集和测试数据集两种，图片...

2018-10-17 01:10:30 1635 2

原创从零开始学深度学习三：logistic回归模型

本笔记来源于深享网课程《深度学习理论与实战TensorFlow》Logistic回归模型是一种广义的回归模型，其与多元线性回归有很多相似之处，模型的基本形式相同，虽然也被称为回归模型，但是需要注意的是，Logistic更多应用在分类问题中，但是又以二分类最为常见。Logistic模型在生活中有非常广泛的应用，比如“学习五个小时，考试能通过还是不能通过？”，“今天要踢足球比赛，赢还是输？”...

2018-10-05 19:31:33 6129

原创从零开始学深度学习二：神经网络

本课程笔记来源于深享网课程《深度学习理论与实战TensorFlow》2.1学习的种类学习的种类主要分成以下三类：监督学习、非监督学习和强化学习三种。接下来，将分别对这三种学习进行介绍。监督学习：对已经标记的训练样本进行学习，然后对样本外的数据进行标记预测。如常见的分类垃圾邮件问题就是常见的监督学习，我们需要对训练样本的邮件进行标记（就是每一封邮件都要人为去指定，然后通过学习，模型对新来...

2018-10-02 21:55:32 1191

原创从零开始学深度学习一：TensorFlow基础

本课程笔记来源于深享网课程《深度学习理论与实战TensorFlow》一、TensorFlow的介绍TensorFlow是一种利用数据流图进行数值计算的开源软件库。图中的节点表示数学运算，而图中的边则代表在这些节点之间传递的多维数组（张量）。这种灵活的架构可让你使用一个API将计算工作部署到桌面设备、服务器或者移动设备的一个或多个CPU 、GPU上。简单的说：TensorFlow是一个深...

2018-09-30 22:55:12 1606

原创【论文阅读】Ensemble of pose aligned features for person re-identification

这篇文章是由华中科技大学图像信息处理与智能控制教育部重点实验室完成，在Control Theory & Applications上被收录，文章对行人重识别的两大挑战：行人姿态变化和场景亮度变化提出改进措施。在阅读这篇文章过程中感觉自己火候未到，有些内容半知半解，等或一段时间再进行更新What1、行人重识别在现实生活中有非常广泛的应用，目前解决这一领域的方法主要有基于表征学习（f...

2018-09-29 20:54:40 709

原创【论文阅读】Improving Person Re-identification by Attribute and Identity Learning

这篇文章是由悉尼科技大学Yutian Lin等人完成，在CVPR2016上被收录。论文地址：https://arxiv.org/pdf/1703.07220.pdf文章主要利用了属性学习（attribute learning）和行人重识别（Re-ID）之间的关系，将在局部特征上表现很好的属性学习和全局学习中的行人重识别方法进行结合，从而构造出一个全新的损失函数，进而提高Re-ID的性能。文...

2018-09-27 19:57:04 4827 3

【论文阅读】

这篇文章是由悉尼科技大学Yutian Lin等人完成，在CVPR2016上被收录。论文地址：https://arxiv.org/pdf/1703.07220.pdf文章主要利用了属性学习（attribute learning）和行人重识别（Re-ID）之间的关系，将在局部特征上表现很好的属性学习和全局学习中的行人重识别方法进行结合，从而构造出一个全新的损失函数，进而提高Re-ID的性能。文...

2018-09-27 18:20:33 664

原创【论文阅读】CVPR2018: Features for Multi-Target Multi-Camera Tracking and Re-Identification

目录本文的主要贡献多目标多相机追踪（MTMCT）和行人再识别（Re-ID）的关系两者的区别两者的联系模型的流程论文结论这篇文章是由杜克大学Ergys Ristani, Carlo Tomasi完成，在CVPR2018上被收录，原文链接为：https://arxiv.org/abs/1803.10859。在CSDN上已经有大神给出这篇非常好的翻译了，因此我不再赘述原文内容，大家可以移步Featu...

2018-09-20 20:05:56 4323 3

原创【论文阅读】CVPR2018:Deep Spatial Feature Reconstruction for Partial Person Re-identification Alignment

这篇paper在CVPR2018上被收录，来自于中科院自动化所孙哲南组，主要探讨了局部行人的再识别问题，在这个问题上，作者提出了一种被称为深度空域特征重建（DSR）的方法,相较于现有的滑窗匹配法（sliding window Matching 、SWM）、部分对部分匹配法（Part-to-part Matching）、形变匹配法（Resize Matching）等，识别效率和准确率都有大幅提高。...

2018-09-18 16:31:56 1868

原创 #【Yolo的听课笔记三】CNN与图像高级应用

【Yolo的学习笔记一】对正则化的理解我是刚刚接触计算机视觉的小白Yolo，很多知识都处于摸索阶段。为了记录自己的学习历程，我在这里把自己的学习内容进行总结. 听课笔记系列是为了整理自己在各个课程中的笔记，主要是回顾课堂内容，也融入了一些自己的理解和网上资料。本笔记来自于七月在线，详细课程介绍请点击深度学习第四期目录【Yolo的学习笔记一】对正则化的理解...

2018-09-13 20:13:41 977 1

原创【Yolo的听课笔记一】七月在线深度学习第四期深度学习初步 Softmax, DNN, Wide&&Deep Model

【Yolo的听课笔记一】深度学习初步 Softmax, DNN, Wide&amp;amp;amp;&amp;amp;amp;Deep Model 我是刚刚接触计算机视觉的小白Yolo，很多知识都处于摸索阶段。为了记录自己的学习历程，我在这里把自己的学习内容进行总结. 听课笔记系列是为了整理自己在各个课程中的笔记，主要是回顾课堂内容，也融入了一些自己的理解和网上资料。## 目录【Yolo的听课笔记一...

2018-09-10 09:11:21 919

原创【Yolo的听课笔记二】七月在线深度学习第四期卷积神经网络与典型结构

【Yolo的听课笔记二】七月在线深度学习第四期卷积神经网络与典型结构我是刚刚接触计算机视觉的小白Yolo，很多知识都处于摸索阶段。为了记录自己的学习历程，我在这里把自己的学习内容进行总结. 听课笔记系列是为了整理自己在各个课程中的笔记，主要是回顾课堂内容，也融入了一些自己的理解和网上资料参考。https://www.cnblogs.com/skyfsm/p/6790245...

2018-09-10 01:03:46 2138

原创【Yolo的学习笔记二】梯度下降法三种形式BGD、SGD、MBGD比较

【Yolo的学习笔记二】梯度下降法分类详解本人是刚刚接触计算机视觉的小白Yolo，很多知识都处于摸索阶段。为了记录自己的学习历程，我计划在这里把自己的学习内容进行总结，希望各位前辈进行批评斧正！注：在写这个系列笔记的过程中参考了很多大牛前辈的文章（在文章结尾附链接），在此深表感谢。梯度下降法是一种被广泛应用于机器学习中的优化方法，用于迭代求解模型中的相关参数。与其他...

2018-09-05 12:06:23 2775

Yolo的博客