_szxy-CSDN博客

原创 OpenCV 提取不规则ROI区域

主要使用opencv中的copyTo()来完成不规则区域的提取。image.copyTo(imageROI，mask)，使用该函数完成不规则区域的提取和覆盖。mask代表掩膜。Mask中所有像素值为零的部分与图像重叠的区域就会不可见，也就是说Mask区域的形状与大小直接决定了你看到最终图像的大小与形状。所以mask中不为0的部分就是不规则区域的形状。mask通常为二值图，白色区域为提取出的...

2020-04-09 21:15:25 1783

从数学方面重新学习目标检测的相关算法和优化原理。可以有助于我们更深刻的理解算法，找到优化方向。这样做当然是一个极为艰难的过程，但是一定要坚持做下去。主要参考吴恩达老师的深度学习课程。首先对于最近在学的网络就要这样学起，所以每次更新的内容可能都不一样，有的可能看不到什么关联性，我会一边更新一边整理的，参考的内容和博文也会一一列在每一部分内容之后。之所以选择这种手打的方式，一面是在打字的过程中进行...

2019-06-25 09:10:15 1355 1

转载转载 Tensorflow 模型量化（Quantizing deep convolutional networks for efficient inference: A whitepaper 译文）

转载自博客：https://blog.csdn.net/guvcolie/article/details/81286349要好好学习一下！1 Introduction Deep networks are increasingly used for applications at the edge. Devices at the edge typically have lower comput...

2019-06-19 11:02:17 981

原创 Tensorflow 模型优化

最近一段时间找实习的经历真的是艰难困苦，大家对机电这个专业本身的认知度就不高。确实机电从名字上看是机械和电子，好像是偏硬件更多点，但实际上这个专业的核心应该是感知和控制，像自动化一样，怎样更好的结合软硬件是我们学习的内容。像我们实验室现在偏向感知更多点，就是使用机器视觉去感知环境，进行图像处理，让控制器做出判断。但是计算机学院有了专门的模式识别，做这个更厉害一些。我们也只能更加努力的去学习弥补差...

2019-06-19 09:15:07 1687 2

原创 yolo v1-v3介绍（代码分析+BN详细介绍）

很早就学过yolo，今天复习重新做个总结，做了个PPT，结果发现传不上来，就贴图上来吧，希望图种不会挂。

2019-06-15 18:00:39 1945

转载人体关键点《Stacked Hourglass Networks for Human Pose Estimation》

Stacked Hourglass Networks for Human Pose Estimation今天做题时遇到了人体关键点的问题。这类神经网络我之前只看过综述类的文章。凭借着印象勉强写了写。今天就找一篇论文学习一下。这篇论文分析解读转载自 https://blog.csdn.net/u013841196/article/details/81048237简介：本文使用全卷积神经网络，对...

2019-06-05 10:02:20 483

原创 LeetCode 初级算法 C++

leetcode 初级算法从认真开始做题到完成初级算法，一共经过了大概两个月的时间。这个过程学到了很多东西，巩固复习了很多接近遗忘的知识，还扩展学习到了一些，感觉有了一种新的思维模式。在这里将这些题目总结，方便日后查阅。//从排序数组中删除重复项class Solution {public: int removeDuplicates(vector<int>& num...

2019-05-27 22:17:58 370

原创 Tensorflow c++接口配置ubuntu

图像处理不应该单单只有深度学习。我决定将数字图像处理和深度学习两部分算法结合在一起。之前的opencv代码都是在c++上完成的，tensorflow使用Python版本的。由此决定配置一个c++接口的tensorflow，将两部分代码融合。但是万万没有想到配置一个自认为简单的接口会耗费将近4天的时间，基本将所有的tensorflow的坑都踩了一遍。本文是在配置成功后，重新回忆梳理整个配置流程。...

2019-05-17 11:26:09 1079

原创 object detection api 构建基于vgg的faster rcnn网络

在上篇文章 https://blog.csdn.net/q199502092010/article/details/89381472 基础之上，参考了https://www.jianshu.com/p/b9e38c1c94b1https://www.jianshu.com/p/4b5ff96e70b5这两篇文章，构建了基于tensorflow object detection api 中的f...

2019-05-03 10:31:16 778 1

原创 object detection API构建自己的网络模型

object detection API构建自己的网络模型首先定位到 object_detection\builders\model_builder.py 该文件是构建各种组件的地方。实现 SSD , Faster R-CNN , R-FCN 三个系列的基本功能，基于不同的分类模型，构建不同的feature_extractor。有博客中说该模块中的 build 是供外部调用的唯一方法，其他模块...

2019-04-18 16:28:55 615 2

原创 Inception 和 resnet 区别

这几天看了inceptionv2，resnetv1，inception-resnet-v2三篇tensorflow slim下的实现。看到最后发现inception模块和resnet模块很相像。到了inception-resnet-v2这篇结合代码，后少能找到resnet的踪迹。那么两者的区别在什么地方呢。和同学讨论了一下，觉得有两个地方。第一，resnet模块是直接将卷积后值相加，没有通道数上...

2019-04-11 19:59:21 2771

原创 Resnet tensorflow代码分析

resnet论文：https://arxiv.org/pdf/1512.03385.pdf翻译转载：https://blog.csdn.net/Quincuntial/article/details/77263562这几天看了tensorflow搭建的resnet模型，十分的干净利落。将结合代码的分析记录，以防遗忘。...

2019-04-09 19:48:27 2081

原创 WARNING:root:Variable [resnet_v1_50/block1/unit_1/bottleneck_v1/conv1/BatchNorm/beta] is not availab

在使用object detection api 进行ssd相关训练时发生错误，显示加载模型里检查点找不到。遇到这个问题有点懵，官方的也会有错。。。依照网上的方法将检查点输出检查import tensorflow as tffrom tensorflow.python.tools.inspect_checkpoint import print_tensors_in_checkpoint_fi...

2019-04-09 11:34:13 1838

原创 R-FCN再学习

R-FCN最近重新学习这篇论文，发现原来的理解里有一些偏差，所以这里重新学习一下。学习期间有两篇文章给我很大的帮助中英文对照翻译http://noahsnail.com/2018/01/22/2018-01-22-R-FCN论文翻译——中英文对照/这篇文章里对平移不变性和平移可变性有着很好的解释https://zhuanlan.zhihu.com/p/32903856我写这篇主要是用自...

2019-04-04 10:27:45 206

转载 Faster-Rcnn最好的翻译

我看过最好的Faster-Rcnn论文翻译https://blog.csdn.net/quincuntial/article/details/79132243，结合tensorflow源码，可以很好的理解Faster-Rcnn，由于转载总出问题，在此记录。...

2019-03-25 17:28:30 1217

原创 object detection API 制作自己的数据集

1.数据标注使用labelImg对图片进行标注，标注后生成 .xml 格式文件，含有图像格式尺寸，标签，坐标的相应内容。如果想要去除文件中的某类标签，可以使用xml.etree.ElementTree库来帮助完成。2.制作数据集新建文件夹名为data set，该文件夹下有两个文件夹images（存放图片）和xml_file（存放标注文件），新建文件夹Annotations，该文件夹内有tra...

2019-03-22 10:14:39 490

原创 Mask R-CNN（精简注释版）

参考博客：https://blog.csdn.net/WZZ18191171661/article/details/79453780http://blog.leanote.com/post/[email protected]/b5f4f526490b论文：https://arxiv.org/abs/1703.06870翻译：https://blog.csdn.net/q19...

2019-01-08 20:16:51 589

转载 Mask R-CNN

本文转载自博客：https://blog.csdn.net/myGFZ/article/details/79136610 正文：摘要我们提出了一个概念上简单、灵活以及通用的目标实例分割框架。我们的方法有效地检测图像中的目标，同时为每一个实例生成高质量的分割掩模。这种叫Mask R-CNN的方法通过添加一个与现有边框识别分支并行的、用于预测目标掩模的分支来扩展Faster R-C...

2019-01-08 20:12:59 364

原创目标检测网络选择（Faster R-CNN，SSD，R-FC） Speed/accuracy trade-offs for modern convolutional object detectors

Speed/accuracy trade-offs for modern convolutional object detectors现代卷积目标检测器的速度/精度折衷主要内容：如何选择目标检测网络：Faster R-CNN，SSD，R-FCN论文原网址：https://arxiv.org/abs/1611.10012翻译部分内容参考:http://tongtianta.site/...

2019-01-07 16:18:05 785

原创 RON: Reverse Connection with Objectness Prior Networks for Object Detection

RON: Reverse Connection with Objectness Prior Networksfor Object Detection针对目标检测的基于目标先验网络反向连接参考http://tongtianta.site/paper/6729https://zhuanlan.zhihu.com/p/33128624https://blog.csdn.net/linol...

2018-12-28 21:28:01 758 1

翻译 RRC：Accurate Single Stage Detector Using Recurrent Rolling Convolution

这篇论文网上翻译不全，自己大概翻译一下，很粗糙，也有一些没看懂，需要用时再回来详细学习吧Accurate Single Stage Detector Using Recurrent Rolling Convolution采用递归滚动卷积的精确单级检测器摘要大多数最近成功的精确物体检测和定位方法使用了RCNN型两级卷积神经网络（CNN）的一些变体，其中在第一阶段提出了合理的区域，然后...

2018-12-27 09:47:20 1065

原创 Faster R-CNN和SSD 重点内容（内附卷积层与全连接层区别）

首先需要说明的是，本文在写时仅仅依靠着对论文的解读，具体代码的实现还没有看。最终可能也不一定会看源码，会找一个合适的进行详细的学习。通过阅读以下两篇论文及翻译，总结出一些网络的特点记录在这里，方便之后的查找。Faster R-CNN https://arxiv.org/abs/1506.01497翻译：https://blog.csdn.net/quincuntial/article/det...

2018-12-26 11:30:47 6330

原创 26种神经网络激活可视化

在网上发现两个很好的资源，将我们常常使用的激活函数进行了可视化的说明，并且说明了各种激活函数的特性。通常针对某些特殊的特征，一些不常用的激活函数会有较好的效果。通常也有助于对于激活函数的理解。网址如下：https://dashee87.github.io/deep learning/visualising-activation-functions-in-neural-networks/htt...

2018-10-10 09:46:57 597

原创 caffe windows 可视化

我是使用cmake的方法进行的caffe的编译，可以看我之前的博客。将caffe目录下的python文件夹中的caffe文件夹拷贝到python\Lib\site-packages路径下。然后在import caffe，出现的一般是升级之类的问题，按照要求解决就行了。之后在spyder中就行模型的可视化。代码内容主要是依据caffe官方的教程而来，添加了mean文件的转化函数。对于自己的网络需要...

2018-09-19 17:01:43 168

原创正则化

虽然一直知道正则化是用于避免网络过拟合，可是不是很清楚为什么可以避免过拟合，昨天通过通过公式才看懂究竟是为什么。今天做一个小总结。在论文中，正则化用“regularization”表示，翻译成中文应该是规则化。规则化是规则什么呢？规则的是我们学习提取到的特征。在学习的过程中，有些时候会出现过拟合的情况，就是对于训练集和验证集有着优秀的拟合预测能力，但是对于测试集或未见过的样本，拟合预测能力...

2018-09-14 15:43:18 10126

原创 svm（支持向量机）简单版本

网上最好的讲解版本，我觉得是这个https://blog.csdn.net/v_july_v/article/details/7624837 从推导到说明都很完整。基于此篇博客和其他资料，我自己推导了简单版本，没有涉及最优化计算和证明，在此记录，此后再有重要知识点还会补充到这篇中。在matlab中可以下载libsvm工具箱进行实验，有很多参数可以调节，比如核函数，惩罚系数等等。SVM...

2018-09-06 14:50:08 285

原创 yolov3 图像批量处理程序

yolov3批量测试代码，网上查找了一篇，稍有些问题，这里贴出修改后代码。原理就是在原有的程序上加了批量的内容。参考博客：https://blog.csdn.net/xczexcel/article/details/80585776void batch_process(char *datacfg, char *cfgfile, char *weightfile, char *read_...

2018-08-03 11:03:07 2917 5

转载直方图均衡化的数学原理

这篇文章写得超好，十分的清晰，还附了推导例程。转载一下，如有侵权，请告知删除。文章原地址https://blog.csdn.net/superjunenaruto/article/details/52431941 直方图均衡化的数学原理直方图...

2018-08-01 21:54:38 265

原创比特平面分层

比特平面分层主要用于图像的压缩，在某些特殊情况下，也可通过二值化的方式实现图像分割的效果。结合网上给出的比特平面分层代码，重新进行了编译。本来想写成类似于src.size().area这样的调用形式，但是没有成功，这里贴出一个简单的逻辑简单的版本。#include<opencv2\highgui\highgui.hpp>#include<opencv2\imgproc...

2018-08-01 21:26:18 619

原创 BP神经网络说明及推导

学习神经网络，很多基础知识不用就会忘了，这段时间重新进行一下整理和总结。在此留做记录。首先从最基础的BP神经网络开始。并进行相关算法的推导。人工神经网络是仿照人大脑的功能而用数学公式搭建的一种结构。现在借助计算机语言在高性能的计算机上得以实现。才能模仿人的神经信号传输变化过程，经过这个过程，完成了计算，识别，分类等等一系列功能。总结起来是在两个方面模拟大脑。1.网络通过学习过程...

2018-07-30 22:11:00 2336

原创 tensorflow官方文档中文版-偏微分方程-可执行版

#python3.6import tensorflow as tfimport numpy as npimport PIL.Imagefrom io import BytesIOfrom IPython.display import clear_output, Image, displaydef DisplayArray(a, fmt='jpeg', rng=[0,1]): a...

2018-07-27 17:26:20 1113

原创 tf.strided_slice详解

tf.strided_slice是多维切片函数，网上给出了很多的说明，可是还是不容易理解，这里给出自己的理解。直接在官网的示例上给出分析strided_slice(input_, begin, end, strides=None, begin_mask=0, end_mask=0, ellipsis_mask=0, new_axis_mask=0, shrink_axis_mask=0...

2018-07-26 10:09:02 4940 1

转载图像二值化方法介绍（转载学习）

ImageJ中图像二值化方法介绍概述二值图像分析在对象识别与模式匹配中有重要作用，同时也在机器人视觉中也是图像处理的关键步骤，选择不同图像二值化方法得到的结果也不尽相同。本文介绍超过十种以上的基于全局阈值的图像二值化方法，其中最大值为255表示白色， 0 表示黑色，H表示图像直方图。imageJ重要开源分支Fiji中已经实现了全局自动阈值16种方法。ImageJ演示首先来看一下原图，是一张人体细胞...

2018-06-03 21:45:29 17836

转载 lmbda用法

一、lambda函数也叫匿名函数，即，函数没有具体的名称。先来看一个最简单例子：def f(x):return x**2print f(4)Python中使用lambda的话，写成这样g = lambda x : x**2print g(4)二、lambda和普通的函数相比，就是省去了函数名称而已，同时这样的匿名函数，又不能共享在别的地方调用。其实说的没错，lamb...

2018-05-28 16:01:07 415

原创 vgg到ssd

VGGVGGNet是2014年提出的卷积神经网络结构,其主要与AlexNet发展而来。同GoogLeNet一样证明加深网络层数是有效的。不过没有那么的炫。贴一篇论文翻译：http://noahsnail.com/2017/08/17/2017-8-17-VGG%E8%AE%BA%E6%96%87%E7%BF%BB%E8%AF%91%E2%80%94%E2%80%94%E4%B8%AD%E6%96%...

2018-05-18 15:45:37 4688

原创 Inception-V1到Inception-V4

GoogLeNet主要思想为Inception结构主要参考了http://caffecn.cn/?/question/255题外话;吴恩达老师的深度学习课程讲的非常的明白。1.对图像进行卷积是压缩提取图像特征信息的一个过程，构造不同的卷积核提取出的就是不同的特征。卷积神经网络厉害的地方是将滤波核当做参数去进行训练，找到各种各样的奇怪特征，这是计算机视觉中最为有效的思想之一。2.关于步长的总...

2018-05-13 22:29:07 902

转载摄像头的像素与分辨率之间的关系

摄像头的像素与分辨率之间的关系最近在看摄像头的驱动,一直没搞懂像素和分辨率之间的关系,特收集来学习一下：我们买数码相机或是评价相机功能的时候，常常提到相机的“像素”这一概念，认为像素大的相机就好，就能拍出精细的图片来，现在有的高档数码相机的像素数高达上千万，一般的家庭用相机的像素达到了四百万到五百万。是不是我们购买相...

2018-05-09 16:41:41 13868

原创 win7 vs2015 caffe CPU版本配置爬坑

新版本的opencv已经不再支持vs2013，而我又想用一些新的函数，就将自己的编译器跟新到了vs2015.相应的caffe也需要用2015重新编译。还需要调用预测函数接口。网上的大部分教程都是用Microsoft的2013版本，这个版本也已经很久没有更新过了。于是自己爬个坑。使用vs2015重新编译。本文参照了以下两篇博客。根据新版本特性加入了一些改动。https://blog.csdn.net...

2018-05-07 23:09:36 2064

原创 C2872 “shared_ptr”: 不明确的符号

今天在自己的工程中调用caffe的预测函数时遇到这个问题，C2872 “shared_ptr”: 不明确的符号。通常来说这个问题是在使用的库中，有重复的函数或者变量，又在头文件中使用了命名空间，导致编译器不知道该调用哪一个库中函数。在caffe源码中，打开shared_ptr的定义文件：可以看到在boost类中，于是将错误处变为 class boost::shared_ptr<Net&lt...

2018-05-07 22:04:42 1951

空空如也

com服务器将一个32位的dll中的函数封装，但在idl文件中类不识别 error2025

vc++ x64编译 调用32位的dll lib 如何实现？

将caffe集成到mfc中，代码可生成，跑开报错，大神求救

vc++ x64编译调用32位的dll lib 如何实现？