donkey_1993-CSDN博客

原创 CFNet: Cascade Fusion Network for Dense Prediction

在密集预测任务中多尺度的特征融合至关重要，当前的主流的密集预测的范式是先通过BackBone提取通用特征，然后通过特征融合模块来融合BackBone中的多尺度特征，最后使用head来输出密集预测结果（检测，分割等）。作者发现BackBone的网络参数量远远大于特征融合模块，基于此发现作者提出了级联融合网络结构（CFNet）来平衡BackBone和融合模块网络的参数占比。最终提出的网络结构在Imagenet，COCO，ADE20K等数据集上取得了领先的结果。

2023-03-06 11:35:52 3026 14

原创 SegNeXt: Rethinking Convolutional Attention Designfor Semantic Segmentation重新思考卷积注意力设计

在当前深度学习语义分割中Transformer占据了主流的方向。作者发现卷积神经网络的注意力机制比Transformer更加高效，更加高效地编码上下文信息。通过对比之前提出的优秀的语义分割模型，作者发现了提升模型分割精度的几个关键因素（如下表所示）。通过以上的发现，作者提出的注意力卷积神经网络SegNext，在VOC数据集上mIOU可以达到0.906地精度，在COCO，ADE20K等数据集上都能够达到先进的分割水平。

2022-09-27 10:10:06 1493

原创 Ubuntu，Windows下编译MNN的推理和模型转化工具

3. 在命令窗口中，进入到MNN所在的目录。cd MNN/build 先进入到build文件夹中。cd MNN/build 先进入到build文件夹中。2. 进入MNN文件夹，然后运行下面命令行。前提已经安装好Visual Studio。（目前最新版本是2.0.0）。（目前最新版本是2.0.0）。...

2022-08-30 19:47:18 1350 1

原创深度学习中的优化函数optimizer SGD Adam AdaGrad RMSProp

当前深度学习中使用到的主流的优化函数有：1. BGD（Batch Gradient Descent）,SGD（Stochastic Gradient Descent）和MBGD（Mini-Batch Gradient Descent）2. Momentum & Nesterov Momentum3. AdaGrad4. RMSProp5. Adam 这三类优化算法是最早的优化算法，它们之前的不同之处是训练时输入图片数量不同。 BGD是采用整个训练集的数据来计算损失函数对参数的梯度

2022-06-10 14:11:44 1126

原创 Pyramid Grafting Network for One-Stage High ResolutionSaliency Detection高分辨率显著图检测算法

论文核心：论文提出了一个单阶段的高分辨率显著图检测算法。该网络结构编码层采用Transformer和cnn融合特征得到全局和局部特征信息，最后通过三段的解码层输出预测结果。论文提出了CMGM的网络结构块和AGL损失函数来融合矫正CNN和Transformer特征信息。同时提出了一个UHRSD的高分辨率数据集。论文整体网络结构：通过上图可以看出，该网络结构本质上是一个编码-解码的网络结构，只是在编码层使用了CNN和Transformer作为并行的编...

2022-04-27 11:35:10 645

原创基于pytorch的深度学习分类算法汇总

分类算法汇总

2022-03-15 12:03:00 2326

原创 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks论文下载地址：https://arxiv.org/abs/1905.11946代码下载地址：https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet论文创新：在有限的资源下平衡网络深度，宽度和分辨率得到一个效果最好的网络结构。上图网络结构分别是（a）.

2021-02-06 09:33:43 268

原创 Improving Convolutional Networks with Self-Calibrated Convolutions 2020CVPR 自校准网络结构

论文下载地址：http://mftp.mmcheng.net/Papers/20cvprSCNet.pdf代码下载地址：https://github.com/MCG-NKU/SCNet论文摘要：当前深度学习中，为提升网络效果，大多数的研究都是集中在修改网络结构上。SCNet中提出了对卷积层的改进，提出了类似于分组卷积的操作，但是每个分组都会互相影响，从而提取更加丰富的特征。该创新在分类和目标检测中在不增加计算量和参数量的基础上取得了很好的精度提升，其他网络结构可以方便嵌入。算...

2020-12-11 09:21:59 321

原创跑通SOLOV1-V2实例分割代码，并训练自己的数据集。

系统平台：Ubuntu18.04硬件平台：RTX2080 supercuda和cudnn版本：cuda10.0 cudnn：7.5.6pytorch版本：pytorch1.2.0环境安装：#创建solo虚拟环境conda create -n solo python=3.7 -yconda activate solo#下载solo源码，并编译git clone https://github.com/WXinlong/SOLO.gitcd SOLOpip instal...

2020-08-17 14:44:35 8451 46

原创 Mask Rcnn环境搭建并训练自己的数据集（三）

数据集准备：我们需要的数据集包括原图，以及第二步为每个json生成的文件夹里面的文件。训练代码：import osimport sysimport randomimport mathimport reimport timeimport numpy as npimport cv2import matplotlibimport matplotlib.pyplot as pltimport tensorflow as tfROOT_DIR = os.path.abspath("

2020-08-13 18:26:34 1070

原创 Mask Rcnn环境搭建并训练自己的数据集（二）准备自己的数据集

安装并运行labelme来标注数据集：#安装labelmepip install pyqt5pip install labelme#运行labelmelabelme使用labelme标注之后每张图片都会生成对应的json标注文件。将数据集转换成mask-rcnn训练数据集：首先需要修改labelme的一些转换文件，找到labelme的安装位置，并找到json_to_dataset.py这个文件。我的文件在D:\anaconda\envs\labelme\Lib\site-pack

2020-08-13 17:00:31 1234

原创 Mask Rcnn环境搭建并训练自己的数据集（一）

硬件平台：RTX2080super 和 GTX1660Ti系统：Ubuntu18.04和Ubuntu16.04Mask-Rcnn代码地址：https://github.com/matterport/Mask_RCNN环境安装：驱动安装：显卡驱动直接通过系统设置 -> 软件和更新 -> 附加驱动直接在这里面安装。我2080驱动选择的是nvidia-435 1660选择的是nvidia-418。如果没有找到显卡驱动就需要添加ppa源...

2020-08-13 16:17:58 823 2

原创将POLY-YOLO代码跑起来的环境配置，poly-yolo训练自己的数据集

系统：ubuntu16.04和ubuntu18.04显卡驱动：网上很多教程，百度一下安装就可以。（最简单直接在软件更新里面安装）cuda安装：下载安装cuda10.0，百度网上很多教程。cudnn安装：下载安装cudnn7.6.5，百度网上很多教程。cuda和cudnn的版本要使用10.0和7.6.5不然会出现一些bug。1. 安装anaconda。https://www.anaconda.com/2. 创建虚拟环境:poly-yolo推荐的python=3.5，但是测试发现pyth

2020-08-05 17:08:50 3209 27

原创 POLY-YOLO: HIGHER SPEED, MORE PRECISE DETECTION AND INSTANCE SEGMENTATION FOR YOLOV3论文阅读

论文下载地址：https://arxiv.org/pdf/2005.13243.pdf代码下载地址：https://gitlab.com/irafm-ai/poly-yolo论文创新：在YOLOv3的基础上进行了改进，解决了YOLO-v3存在标签重写和anchor分布不均衡问题。同时还增加了基于多边形预测的实例分割算法。改进之后的算法参数量只需要YOLO-v3的60%，速度快了2倍，精度提升了40%，可以进行实时实例分割。YOLO-v3存在的问题：1. 标签重写问题：从下图可以看出YOL

2020-08-05 12:16:29 653

原创 Training-Time-Friendly Network for Real-Time Object Detection论文阅读

论文：Training-Time-Friendly Network for Real-Time Object Detection下载地址：https://arxiv.org/pdf/1909.00700v2.pdf代码地址：https://github.com/ZJULearning/ttfnet摘要：在当前目标检测算法中，很难有算法可以将训练时间，检测速度和检测精度三者协调起来。为了能够在这三种情况下找到一个有效的平衡，作者提出了TTFNet这个网络结构。在CenterNet的基础上在不减低精

2020-07-13 18:54:23 584

原创 python实现欺诈检测 logistic回归逻辑回归算法

1.数据集下载：链接: https://pan.baidu.com/s/1zUxSxwiProvfmAAWjyYb4w 密码: 6eai 代码下载：链接: https://pan.baidu.com/s/1KyVOEU3p-sfCQIauCXGWIA 密码: tgrh2.代码的实现：#添加声明import tensorflow as tfimport numpy as npim...

2020-06-30 11:22:41 6543 3

原创基于python opencv的图像光照增强算法的代码实现。

在做检测过程中发现光照对于检测的精度影响很大，为了不增加采集标注数据工作量，增加了光照数据集来增强检测效果。代码1：选取需要光照增强的区域，直接将像素值增加到240-255之间。import cv2import matplotlib.pyplot as pltimport randomimg = cv2.imread('000100000910000000098.jpg')h,w,c = img.shapeprint(h,w)start_x = 510start_y = 1000f

2020-06-30 10:18:00 6518 5

原创图片预处理操作中的均值操作mean的作用以及实现代码

在进行目标检测或者分割的时候需要对图片先进行mean的预处理操作，这样做的作用是将原始图片减去整个数据集的像素均值，这样可以体现不同个体之间的区别与差异。代码实现：import numpy as npimport cv2import os # img_h, img_w = 32, 32img_h, img_w = 300, 300 #根据自己数据集适当调整，影响不大means, stdevs = [], []img_list = [] imgs_path = '/media/

2020-06-28 15:40:15 1580

原创 End-to-End Object Detection with Transformers论文阅读笔记

论文下载地址： https://arxiv.org/abs/2005.12872代码下载地址： https://github.com/facebookresearch/detr摘要：该算法简化了目标检测算法的流程，同时将那些需要手动设计的技巧nms（极大值抑制）和anchor成功的删除掉，实现端到端自动训练和学习。DETR算法使基于集合的全局损失函数，通过二部图匹配和编码解码网络结构来强制进行唯一的预测。给定一小组固定的经过学习的object queries（后面会讲到什么是object que.

2020-06-24 11:11:03 6333

原创 A Simple Baseline for Multi-Object Tracking多目标跟踪算法

论文下载地址：https://arxiv.org/abs/2004.01888代码下载地址：https://github.com/ifzhang/FairMOT论文摘要：近几年目标检测算法和重识别算法发展迅速。这两个是多目标跟踪算法的重要组成部分。但是现在很少有人关注，将这两个算法合并在一个网络上，因为在初期的时候就有人尝试过这种方法但是重识别网络学习的特征并不好，从而造成跟踪精度大幅下降。论文作者基于以上问题，提出了一个简单基准来提升单网络多目标跟踪算法的精度，并且取得了state-of-the-

2020-05-27 17:07:47 3173

原创 MNN深度框架学习教程（一）编译MNN，并跑通MNN的demo

实验环境：系统：Ubuntu18.04硬件设备：PC设备和树莓派4B编译教程： MNN框架主要分为三部分：推理，训练和转换。推理：在端侧加载MNN模型进行推理的阶段。训练：训练框架上，根据训练数据训练出模型的阶段。转换：将其他训练框架模型转换为MNN模型的阶段。因此我们的编译也需要分三部分来进行编译。首先下载MNN：(我这个是使用码云进行了加速)git clone https://gitee.com/zhanzzw/MNN.git环境要求：cmake（建议...

2020-05-27 15:25:47 14846 11

原创将COCO数据集转成VOC数据集，还可以提取单独的类别分离出来，像行人检测数据集。

最近的项目需要对行人进行检测，网上搜集的数据集比较少因此手动将COCO数据集里面的行人类别单独分离出来，并设置为xml格式。1. 首先准备COCO数据集，只需要训练数据集就够用了。图片下载地址：http://images.cocodataset.org/zips/train2014.zip标签下载地址：http://images.cocodataset.org/annotations/annotations_trainval2014.zip2. 将下载好的数据集解压。3. 运行pyth

2020-05-22 15:10:43 5357 6

原创霍夫圆检测进行钢管检测

通过霍夫圆检测来检测图片中的圆形。HoughCircles里面的参数是可以自己设置的，具体参数的设置，在文章的最后。import cv2 as cvimport numpy as npimage1 = cv.imread("zzw.jpg") #读取要检测的图片se = cv.getStructuringElement(cv.MORPH_RECT, (3, 3))image = cv.morphologyEx(image1, cv.MORPH_GRADIENT, se)cv.imwri

2020-05-12 16:56:55 2866

原创记录在训练深度学习算法过程中遇到的问题及解决办法。持续更新中....

问题1. RuntimeError: received 0 items of ancdata"解决办法主要由两种：(出现这种错误是因为文件描述器共享策略达到了峰值)（1）将代码里面的num_workers的值设为0num_workers=0(2) 在import torch 后面增加一句话就可以解决这个问题import torchtorch.multiprocessing.set_sharing_strategy('file_system')问题2. 在复制数据集到U盘上面的时

2020-05-11 16:00:42 5486 1

原创树莓派4B快速安装pytorch，torchvision和opencv

树莓派安装pytorch1.3和torchvison0.4.0：直接使用命令：pip3 installtorch-1.3.0a0+de394b6-cp37-cp37m-linux_armv7l.whlpi3 installtorchvision-0.4.1a0+a263704-cp37-cp37m-linux_armv7l.whl就可以安装好pytorch和torchvisio...

2020-04-13 09:54:22 6301 8

原创 SOLO：Segmenting Objects by Locations阅读笔记

论文下载地址： https://arxiv.org/abs/1912.04488论文摘要：当前实例分割算法大部分是先检测后分割的框架，例如Mask-RCNN算法。或者先进行语义分割，然后再通过聚类算法来进行分类。论文提出了一种实例类别概念，实例类别根据实例的位置和大小为实例中的每个像素分配类别，从而很好地将实例分割转换为可分类解决的问题。论文提出的犯法可以达到和Mask-R...

2020-04-08 15:28:13 2216

原创在Jetson TX2和RTX2080TI上面安装pycuda，以及遇到的一些问题解决办法。

Jetson TX2上面安装pycuda：sudo pip3 install pycuda安装过程中不会报错但是在测试demo的时候会报无法找到nvcc路径问题。找到compiler.py文件，直接将ncvv的路径改为绝对路径就可以了。RTX2080TI安装pycuda：使用的是anaconda：pip install pycuda安装过程中也不会报错，运行demo就...

2020-03-24 08:54:57 2417 2

原创 FCOS: Fully Convolutional One-Stage Object Detection论文笔记

论文下载地址：https://arxiv.org/pdf/1904.01355.pdf论文代码：https://github.com/tianzhi0549/FCOS/论文创新点：本文作者提出了一种基于特征图像素点的目标检测算法。对特征图的每一个点都会通过回归网络预测一个检测检测框。该算法的优点是计算量减少了（不需要计算过检测框和真实框的IOU），超参减少了（不需要考虑anchor的大小设...

2020-03-18 19:22:08 1592

原创融合卷积层和BN层加速网络

BN层可以通过1*1的卷积层来代替，因此可以将BN层添加到前面的卷积层里面。链接：https://github.com/ziweizhan/fuse-conv-bn import torch import torchvision def fuse(conv, bn): fused = torch.nn.Conv2d( ...

2020-03-09 17:15:24 2317

原创 CBAM: Convolutional Block Attention Module

论文下载地址：https://arxiv.org/pdf/1807.06521.pdf论文代码：https://github.com/ziweizhan/CBAM论文创新：论文核心是提出了新的通道注意力网络结构和空间注意力网络结构。这两个网络结构简单不会影响网络检测速度，还可以将注意力网络结构嵌入到任何CNN网络里面，适应性强。网络结构：整体网络结构：如下图所示...

2020-02-28 12:42:26 1770

原创 Actions as Moving Points

论文下载地址：https://arxiv.org/abs/2001.04608代码地址：https://github.com/mcg2019/MOC-Detector论文创新点：当前存在的动作识别检测算法大多数都是基于anchor的，算法计算量大，并且anchor对于检测运动实例效果并不友好。作者基于以上问题提出了一个新的行为识别检测框架，将每一个运动的实例看做是移动的点（类似于Cente...

2020-02-11 18:03:27 2527

原创 IoU，GIoU，DIoU和CIoU三种目标检测loss

IoU：使用最广泛的检测框loss。GIoU：2019年CVPR Generalized Intersection over Union: A Metric and A Loss for Bounding Box RegressionDIoU和CIoU：2020年AAAIDistance-IoU Loss: Faster and Better Learning for Bound...

2020-01-16 17:49:31 22360

原创鱼眼摄像头的畸变矫正方法-python+opencv

鱼眼摄像头畸变校正的方法：1. 棋盘矫正法2. 经纬度矫正法。相机为什么会出现畸变？当前相机的畸变主要分为径向畸变和切向畸变两种。径向畸变产生的原因：相机的光学镜头厚度不均匀，离镜头越远场景的光线就越弯曲从而产生径向畸变。切向畸变产生的原因：镜头与图像传感器不完全平行造成的。 ...

2020-01-09 16:42:14 21793 10

原创在Jetson nano上面可以跑到20FPS的行人检测算法

演示视频地址：https://www.bilibili.com/video/av76489439/代码地址：https://github.com/ziweizhan/fast-object-detection-nano这个代码训练只训练了100个EPOCH，效果并不是很好。后面需要好好训练。...

2019-11-21 18:02:02 3273

原创 Fast Visual Object Tracking with Rotated Bounding Boxes SiamMask_E目标跟踪算法论文笔记

Fast Visual Object Tracking with Rotated Bounding BoxesICCV-2019-workshop论文下载地址：https://arxiv.org/abs/1907.03892论文代码下载地址：https://github.com/ baoxinchen/siammask_e论文创新点：本论文是基于Siammask进行改进,Siamm...

2019-11-20 17:47:27 2562

原创 jetson TX2 nano快速安装pytorch

1. 去网站https://devtalk.nvidia.com/default/topic/1049071/jetson-nano/pytorch-for-jetson-nano/ 按照教程下载安装就可以。这个适用于任何嵌入式设备。2. opencv的快捷安装方式 sudo pip3 install python3-opencv...

2019-10-29 10:37:48 2951 1

原创 pytorch转tensorrt遇到的一些问题？

1.AttributeError:module 'tensorrt' has no attribute 'PaddingMode'解决办法：是tensorrt版本问题，可以将版本升级到5.1+就可以解决这个问题。2.ValueError: negative shift count解决办法：这个是由于softmax参数设置造成的错误，之前softmax（dim=-1），将dim = ...

2019-10-29 10:22:00 2705

原创 Jetson TX2安装jetpack4.2.2系统

1. 使用数据线将TX2和另外一台ubuntu系统的电脑（也叫上位机）（我的是ubuntu18.04）连接起来。如下图灰色线所示：2. 上位机上面下载sdk，下载地址：https://developer.nvidia.com/embedded/jetpack3. 安装sdk：sudo apt install ./sdkmanager_0.9.14-4964_amd64.deb4...

2019-10-29 10:06:16 2996 3

原创 Adaptively Connected Neural Networks论文阅读

Adaptively Connected Neural Networks论文下载地址：https://arxiv.org/abs/1904.03579论文代码地址：https://github.com/wanggrun/Adaptively-Connected-Neural-Networks论文创新点：论文中提出局部信息和全局信息对于网络结构的精度影响很大，但是当前的网络结构很难同时兼...

2019-10-15 18:04:14 2721 1

原创 Jetson TX2安装编译pytorch

工作需要将deepsort移植到TX2上面，从网上搜集了教程。安装教程：1. 最好是重新安装一个jetpack系统，3.2及以上都可以。2. 首先安装环境依赖：因为是在python3下面安装pytorch，所以使用pip3。sudo apt install libopenblas-dev libatlas-base-dev liblapack-dev# For OpenCVs...

2019-10-14 11:52:49 2675 2

空空如也

空空如也