liqiming100-CSDN博客

原创图像中任意形状ROI（以opencv为例）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录前言一、ROI是什么？二、多边形ROI处理思路1.多边形ROI的定义2.多边形ROI的复制总结前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言本文主要讲述多边形ROI的常用处理思路。提示：以下是本篇文章正文内容，下面案例可供参考一、ROI是什么？ROI是什么呢？ROI是图像中的一个概念，叫做感兴趣区域，是对图像局部区域操作的手

2021-06-26 16:27:28 1626

原创人脸识别系统二三事之2D人脸对齐最佳实践

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习..

2021-06-19 14:08:56 473

原创物体检测框架之mmdetection源码阅读（3）

本篇要解决的问题是如何通过configs文件来构建detector的问题，话说上一回讲到了构建detector前要在mmcv中注册模型。那么如何注册模型呢？暂且切回到上篇的代码的前几行

2021-06-19 11:18:14 1653 1

原创物体检测框架之mmdetection源码阅读（2）

首先从build_detector()开始介绍，先贴出代码import warningsfrom mmcv.cnn import MODELS as MMCV_MODELSfrom mmcv.utils import RegistryMODELS = Registry('models', parent=MMCV_MODELS)BACKBONES = MODELSNECKS = MODELSROI_EXTRACTORS = MODELSSHARED_HEADS = MODELSHE

2021-06-19 10:13:49 1494

原创将tensorflow 改写为 pytorch系列之 pad函数的区别

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机...

2021-06-19 00:07:14 1017 1

原创《An End-to-End Neural Network for Image Cropping by Learning Composition from Aesthetic Photos》

论文：ACNet: Strengthening the Kernel Skeletons for Powerful CNN via AsymmetricConvolution Blocks论文链接：https://arxiv.org/abs/1908.03930代码链接：https://github.com/DingXiaoH/ACNet图像分类领域，从VGG到DenseNet那几年是比较活跃的，最近两年这个领域的论文越来越少见了，要做出有影响力的工作也越来越难。而这两年这个领域的主要方向集中在：

2021-06-18 23:23:06 195 1

原创 towards open world object detection

以往一直零零散散关注life long learning、incremental learning。现在有个比较实用的代码开源出来了。是不是应该尽快试一试。明天要整理一下一系列的物体检测的论文，从小物体检测到遮挡物体检测等等。https://github.com/JosephKJ/OWOD...

2021-03-13 22:56:34 537

原创简单问题-batch normalization的位置

batch normalization的位置关于BN位置的一点点个人愚见关于BN位置的一点点个人愚见首先要说明的是我认为BN一定是要放在激活函数前头的。为什么呢？理由很简单，如果BN放到激活函数后，那么我们知道激活函数实际上给feature map带来一些非线性，典型激活函数如RELU=max(0,x)以及sigmoid函数的输出都是正数，那么经过这些激活函数后的feature map都是正数。那么假设我们在这些激活函数后在加上BN，那么我们知道BN的目的是将feature map的分布拉到均值为零，方

2021-03-13 22:47:29 825

原创学习用markdown多写博客，记录所思所想。

https://markdown-it.github.io/

2021-03-13 22:18:41 79

原创 An End-to-End Neural Network for Image Cropping by Learning Composition from Aesthetic Photos

智能构图整体框架（方法）文章的亮点可能的优化方向参考文献整体框架（方法）这篇文章主要阐述怎么从一张图中获取到一张比较好看的crop的图。大致的流程图如下所示：文章的亮点文章中可以借鉴的地方主要在于文章中汲取传统数字图像处理的方法。最典型的莫过于soft binarization layer:通过这个layer，可以增强salient feature map。效果如下所示：可能的优化方向这篇论文提出了一种智能crop的方法，但是却存在如下的不足：1、模型所占内存过大，训练好的模型

2020-07-20 22:47:46 264

原创现如今浮躁的算法工程师满大街都是

一点点思考对于现如今算法工作的思考对于现如今算法工作的思考如今的风气不好，怎么才能清者自清或者脱颖而出呢？不知道是国人的天性还是怎么的？现在街上大妈都说自己在做算法，而且还是CV算法，github上clone一下，换个dataset就是自己的东西了。看来还是得多看论文多总结，形成知识体系以及解决问题的独特方法，否则人云亦云则非常可悲。勿在浮沙筑高台。...

2020-07-20 22:26:09 177

原创浅谈物体检测中模型加速策略的选取（持续修改中）

众所周知，模型的精度、前向推理速度以及内存占用等等都是用户极为关注的问题。本人持续关注物体检测领域的相关东西，特在此总结一下物体检测模型中通常可用的前向推理速度加速策略。主要从以下几点来说明：1、模型压缩（SVD等方式）；2、模型蒸馏；3、模型量化；4、模型剪枝；本文就先按照以上四个方面来分别说明。（一）模型压缩模型压缩其实我很少去关注的方面，为什么呢？据说伴有精度...

2020-04-05 12:45:51 231

原创物体检测框架之mmdetection源码阅读（1）

通过readme不难发先单卡训练是以tools/train.py作为程序的入口。首先贴出train.py的源代码。from __future__ import divisionimport argparseimport copyimport osimport os.path as ospimport timeimport mmcvimport torchfrom mmcv ...

2020-04-02 20:30:32 1572 2

原创简单的问题往往不简单之同时求数组的最大值和最小值

如果单独求数组的最大值或者最小值，那么必须要做n-1次比较。以下就以求最小值为例来说明，详细代码如下（talk is cheap, show me the code):int minimum( vector<int>& vec ){ int size = vec.size(); if ( size == 0 ) { retur...

2020-03-18 21:29:34 248

原创物体检测总览（持续修改）

用一张思维导图将object detection领域关注的知识以及相关问题先列出来，以防止工作中只见树木不见森林，与各位共勉。

2020-03-15 13:40:28 140

原创 Valid Perfect Square

class Solution {public: bool isPerfectSquare(int num) { if ( num == 0 ) { return true; } if ( num == 1 ) { return true; }...

2019-11-18 22:52:46 87

原创 leetcode 1137

class Solution {public: int tribonacci(int n) { int result = 0; if ( n <= 1 ) { return n; } if ( n == 2 ) { return 1; ...

2019-11-13 22:15:30 113

原创《Gradient Harmonized Single-stage Detector》论文阅读以及代码分析

由于香港中文大学多媒体实验室在深度学习时代发表论文的数量以及质量都是值得称赞的，故此对于算法工程师好好学习下https://github.com/open-mmlab/mmdetection是很有必要的。这篇论文主要是引入了新的loss解决物体检测中positive example和negative example的问题以及easy example和hard example的问题。首先先贴出mmd...

2019-09-21 17:12:16 720 3

原创 RGB到depth image的蒸馏

我们很容易得到RGB image，而depth image就没那么容易了。depth image的数量级也远远小于RGB image。某些利用depth image训练的模型的精度在很大程度上也低于RGB image的精度。那么这个问题可以怎么解决呢？以下几种方案是比较典型的：1、finetune RGB image model to the Depth image model。2、d...

2019-08-25 19:37:34 1194

原创 mobilenet V3论文笔记

论文亮点：1、优化激活函数（可用于其他网络结构）Wesettled on using the hard swish nonlinearity for this layeras it performed as well as other nonlinearities tested. Wewere able to reduce the number of filters to 16 wh...

2019-05-09 23:15:50 1792

原创快速人脸检测论文阅读系列之《FaceBoxes:A CPU Real-time Face Detector with High Accuracy》

介绍：人脸检测中速度和精度的平衡很难做到。虽然像cascaded cnn\MTCNN人脸检测精度和速度上已经都很快了，但是这两个网络结构都有以下问题存在：1、推理时间随着图像中人脸个数的增加而增加；简要说明：级联的CNN用来做人脸检测，往往是第一个CNN用来产生候选的区域，然后再将候选区域送入后续的CNN中。那么图像中人脸个数的增加，候选区域的个数也就增加，这样势必会...

2019-04-18 23:26:20 546

原创论文阅读之《Random Erasing Data Augmentation》

本篇论文主要贡献如下：引入新的data augmentation method，并证明了其在抗遮挡方面的鲁棒性，并且提高了模型的泛化性。在行人再识别方面尤其有良好的表现，在其他任务：如分类以及物体检测方面也有良好的表现。采用Random Erase方法后的图以及原图如下所示：主要的算法流程如下所示：...

2019-04-09 23:25:08 3025

原创物体检测的data augmentation

https://github.com/Paperspace/DataAugmentationForObjectDetection

2019-04-08 22:53:05 162

原创论文解读之《Augmentation for small object detection》

本文主要讲述了针对小目标检测问题中的data augmentation手段。主要贡献如下：1、提出并证明采用copy and paste方式可以增强小目标检测的精度。2、对小目标采用over sampling（过度采样）的方式（会减小中等物体和大物体的检测精度）。copy and paste方式主要是将小物体在图像中随机多复制几份。...

2019-04-08 22:49:44 996

原创系列论文阅读之知识蒸馏（二）《FitNets : Hints for Thin Deep Nets》

本文成果：从一个wide and deep的网路蒸馏成一个thin and deeper的网络。主要的方法如下图所示：实际上是在KD的基础上，增加了一个中间层的知识蒸馏。以下是KD的主要方法：训练要点：两个loss function:（1）Teacher网络的某一中间层的权值为Wt=Whint，Student网络的某一中间层的权值为Ws=Wguided。使用一...

2019-03-31 21:15:51 2958

原创经典论文阅读《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》简短阅读笔记

本论文提出了大名鼎鼎的VGG网络结构。关键要点如下所示：2个stacked 3*3 卷积的作用（中间没有pooling layer）的感受野和5*5的卷积的感受野一样;3个stacked 3*3 卷积的作用（中间没有pooling layer）的感受野和7*7的感受野一样；那么本论文中提出的采用3*3的卷积的作用在于以下两点：1、make the decision functi...

2019-03-14 19:55:02 619

原创 caffe 源码阅读之softmax data layer

勿在浮沙筑高台。国人大多浮躁，猪都喜欢往风口跑，曾经的我也不例外。template <typename Dtype>void SoftmaxLayer<Dtype>::Reshape(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>...

2019-03-14 15:14:12 190

论文解读之Depthwise Sparable Convolution（Xception的核心模块）

2018-11-27 23:43:56 427

原创论文解读PydMobileNet: Improved Version of MobileNets with Pyramid Depthwise Separable Convolution

本篇论文采用多个（金字塔）depthwise convolution来代替传统的depthwise convolution。作者是受到Inception模块的启发而得到的灵感。那么既然如此，首先就来看看原始的native Inception模块的结构以及其优缺点。native Inception 模块如下所示：Inception module 的提出主要考虑多个不同 size ...

2018-11-27 23:17:50 623

原创深度学习算法工程化之JNI

训练出来的模型会被部署到各个终端平台，部署到PC上或者类似PC的硬件架构上都是很容易的事情。现在很多模型都会被部署到安卓平台。由于之前并没有接触过安卓开发，所以这里简要记录下一些关于部署到安卓平台上的一些东西。由于我一直比较喜欢用caffe框架，所以本文针对的是将caffe模型部署到安卓平台。caffe mobile相关的东西就不提了，这里主要说下JNI。首先建立一个安卓工程，比如用a...

2018-11-11 17:04:06 660

原创 Check failed: status == CUDNN_STATUS_SUCCESS (6 vs. 0)

一开始以为是batch size设置得太大，将batch size 设置为 1 后出现如下得错误。CUDNN_STATUS_SUCCESS (1 vs. 0) CUDNN_STATUS_NOT_INITIALIZED修改CMakeLists.txt的第41行，即如下的行； caffe_option(USE_CUDNN "Build Caffe with cuDNN library ...

2018-10-23 13:51:44 1489

转载 windows10 caffe

# Windows Caffe#编译的时候一定要用python2.7或者python3.5,其他版本的python暂时不支持。 **This is an experimental, community based branch led by Guillaume Dumont (@willyd). It is a work-in-progress.** This branch o...

2018-10-16 16:31:02 389 6

原创 Windows10 下 YOLOv3配置教程

需要修改的文件: 打开darknet/build/darknet/darknet.vcxproj，将14全部替换为12 另外需要将CUDA 9.1改为CUDA 8.0 第105行改为 <CodeGeneration>compute_30,sm_30;compute_61,sm_61</CodeGeneration> 将Visual Studi...

2018-09-21 15:06:11 1142

转载（Caffe）LSTM层分析(转)

本文内容：本文描述了Caffe中实现LSTM网络的思路以及LSTM网络层的接口使用方法。本文描述了论文《Long-term recurrent convolutional networks for visual recognition and description》的算法实验本文不做LSTM原理介绍，不从数学角度推导反向传播，不进行Caffe详细代码分析本文基于对Caffe的代码...

2018-09-07 18:03:46 1536 1

转载修改MTCNN中caffe源码，时计算loss时以对应标签是否为“-1”判别（转）

MTCNN训练不收敛原因:地址： https://github.com/dlunion/mtcnn我们的训练数据标签格式：wider face:pos/001.jpg 1 x1 y1 x2 y2 (x1 y1 x2 y2) -1 -1 -1 -1 -1 -1 -1 -1 -1 -1part/001.jpg -1 x1 y1 x2 y2 (x1 y1 x2 y2) -1 -1 ...

2018-09-04 11:06:01 296

原创线段树为什么要开辟4倍的空间？

struct list { int left; int right; int _max; }tree[maxn*4]; 如上述代码所示，我们在写线段树的模板时，别人会告诉我们开4倍的数组就不会溢出了，然而原因是什么，现在证明一下首先线段树是一棵二叉树，最底层有n个叶子节点（n为区间大小）那么由此可知，此二叉树的高度为,可证...

2018-09-02 21:36:40 3440 4

转载机器学习常见评价指标：AUC、Precision、Recall、F-measure、Accuracy（转）

主要内容 AUC的计算 Precision、Recall、F-measure、Accuracy的计算 1、AUC的计算 AUC是一个模型评价指标，用于二分类模型的评价。AUC是“Area under Curve（曲线下的面积）”的英文缩写，而这条“Curve（曲线）”就是ROC曲线。为什么要用AUC作为二分类模型的评价指标呢？为什么不直接通过计算准确率来对模型进行评...

2018-08-27 14:16:02 1057

转载 Squeeze-and-Excitation Networks 解析（转）

论文：Squeeze-and-Excitation Networks 论文链接：https://arxiv.org/abs/1709.01507 代码地址：https://github.com/hujie-frank/SENet PyTorch代码地址：https://github.com/miraclewkf/SENet-PyTorchSequeeze-and-Excitation(S...

2018-08-27 13:43:48 882

转载 generate_anchor.py运算解读(转)

为自己普及一下生成anchor的函数实现原理，方便看懂原理，追随源码(generate_anchors.py)： def generate_anchors(base_size=16, ratios=[0.5, 1, 2], scales=2**np.arange(3, 6)):base_anchor = np.array([1, 1, base_size, base_size]) - 1...

2018-08-24 15:03:11 455

原创 the loss function of the deep learning

1、softmax loss2、the related softmax loss3、triplet loss4、center loss5、ring loss未补充完整，截至2018年7月12日。

2018-07-12 15:54:38 365

java web企业事务管理系统

空空如也