zhaoshenlu829-CSDN博客

原创 3D目标检测-二阶段方法（region proposal-based Methods）之基于语义分割的方法（Segmentation based）解读

3D目标检测–region proposal-based Methods–Segmentation based Methods：该类方法直接输入原始点云数据，需要用到PointNet和PointNet++，因此先对这两种点云数据的特征提取方法进行简述。1、PointNet（CVPR 2016）动机：典型的卷积网络需要格式高度规则的输入数据，比如图像网格或3D体素。由于点云数据具有无序性，大多数研究人员通常会将其转换成规则的3D体素网格或图像集合(例如多视图图像)，然后再将它们送入深度神经网络中提

2021-01-14 09:07:29 1734 2

原创 3D目标检测-二阶段方法（region proposal-based Methods）之基于多视角的方法（Multi-view based）解读

3D目标检测–region proposal-based Methods–Multi-view basedMethods：1.MV3D（2017 CVPR）鸟瞰图的优势：首先，物体在投影到鸟瞰图时保持了物理尺寸，因此具有较小的尺寸差异，这与前视图/RGB图平面的情况不同。其次，鸟瞰图中的物体占据不同的空间，从而避免了遮挡问题。第三，在道路场景中，由于物体通常位于地面上，垂直位置的变化很小，鸟瞰位置对于获得准确的三维边界盒更有优势。算法流程：输入的鸟瞰图包含M个高度图切片，一个密度图和一个强

2021-01-14 08:55:23 1726 1

原创 RGB-T行人检测汇总

**RGB-T行人检测汇总**1.介绍 2015年，第一个RGB-T行人检测数据集KAIST被提出，多光谱行人检测任务逐渐成为计算机视觉领域的研究热点之一。可见光相机可以在光照条件良好的条件下清晰地捕捉到行人的细节信息和颜色信息，但在弱光照甚至黑夜的环境下很难捕捉到有效的目标信息；而红外相机对外部光照变化不敏感，通常可以呈现出人体清晰的轮廓，但会丢失了人体的细节信息和颜色信息。因此，可见光图像和红外图像所提供的信息是互补的，如果可以有效地融合两种不同光谱类型的图像，就能得到更丰富的目标特征，增强行人检测

2020-07-08 15:37:48 5375

原创 Fully Convolutional Region Proposal Networks for Multispectral Person Detection(CVPRWorkshop 2017)解读

Fully Convolutional Region Proposal Networks for Multispectral Person Detection一、Overview 本文的思路主要来源于Faster R-CNN。已有研究表明，仅使用RPN结构检测的结果和Faster R-CNN的效果相差不大，因此本文的方法主要分为两个阶段：首先通过RPN结构对RGB信息和T信息融合后的结果进行检...

2020-04-02 19:02:14 918

原创 Learning Cross-Modal Deep Representations for Robust Pedestrian Detection（CVPR2017）论文解读

**Learning Cross-Modal Deep Representations for Robust Pedestrian Detection**一、Overview 本文设计了一个多光谱行人检测模型，与融合RGB信息和T信息的思路不同的是，本文没有选择在一个模型中融合两种模态的信息，而是先在训练过程中通过一个无监督学习的方法从对应的RGB图像中重建T图像。该模型主要包括两个阶段：首先...

2020-04-02 18:50:15 696

原创 Multispectral Deep Neural Networks for Pedestrian Detection（BMVC 2016）论文解读

Multispectral Deep Neural Networks for Pedestrian Detection（BMVC 2016）一、Overview 随着2015年第一个RGB-T行人检测数据集KAIST的提出，多光谱行人检测任务成为了当时的研究热点之一，与此同时2016年何恺明提出的Faster R-CNN模型在单模态（RGB）目标检测领域取得了显著的效果。本文主要受Faster...

2020-03-26 17:56:59 893 1

原创多光谱（RGB-T）语义分割第二个数据集-PST900论文解读

PST900: RGB-Thermal Calibration, Dataset and Segmentation Network一、Overview RGB-T语义分割可以应用于机器人自主环境感知领域（医学、农业、自动驾驶等等）。本文提出了第二个RGB-T数据集PST900以及一种新的RGB-T语义分割网络。实验表明，本文提出的模型在PST900中取得了目前最好的分割效果，但是在MFNet提...

2020-03-26 17:20:58 3656 2

原创多光谱（RGB-T）语义分割2019-RTFNet总结

RTFNet: RGB-Thermal Fusion Network for Semantic Segmentation of Urban Scenes一、Overview 2019年的一篇RGB-T语义分割论文，创新点在于提出了一个新的编码器-译码器模型。实验结果表明，本文提出的RTFNet在MFNet提出的数据集中取得了目前最好的分割效果。二、 Additional knowledge...

2020-03-26 17:07:45 3351 17

原创 MFNet-多光谱（RGB-T）语义分割第一篇

标题MFNet: Towards Real-Time Semantic Segmentation for Autonomous Vehicles with Multi-Spectral Scenes一、OverviewRGB-T图像的语义分割可以用于自动驾驶，用于克服夜晚光照差以及天气条件恶劣的情况。本文提出了第一个RGB-T的语义分割数据集（城市场景），同时提出了MFNet模型用于多模态（R...

2020-03-26 16:48:55 9903 7

原创多光谱（RGB-T）行人检测、语义分割研究汇总

当前的研究目标转向多光谱（RGB-T）语义分割和行人检测任务，我将对近些年使用深度学习算法设计的模型进行详细分析。以下为截止到2020年初已公开发表的论文目录。这两个领域的相关论文很少，主要原因还是数据获取和对齐的难度较大以及有效的多模态融合算法设计难度较大，两种模态间的信息差异性较大，因此使用简单融合方法的效果比较差。多光谱语义分割和行人检测都是目前只有两个数据集，之后会在论文详解中进行介绍。...

2020-03-26 16:20:52 5278

原创语义分割之FCN

**　　论文：Fully Convolutional Networks for Semantic Segmentation**一．内容简介本文提出了一种全卷积神经网络（FCN），选择一些经典的CNN结构将它们的全连接层用卷积层替换，再使用反卷积操作进行上采样使这些CNN得到的feature map恢复到输入图片的尺寸。FCN实现了逐像素的预测，最终得到的结果是一个与输入图片尺寸相同的热图，对...

2019-12-16 22:17:28 756

原创 APCNet语义分割论文总结

论文：Adaptive Pyramid Context Network for Semantic Segmentation一．论文简述　　本文主要设计了一种自适应金字塔上下文模型（APCNet），与其他现有的语义分割模型相比，它包含了多尺度（MS）、自适应、全局指导局部亲和力（GLA）三大特性，经实验表明其性能优于现有的其他模型。（上下文信息指的是被检测目标附近的一些信息，对目标检测可以起...

2019-10-15 21:14:58 1066

原创 ShuffleNet论文总结

论文：ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices一、内容简述　　本文受到group convolution方法（最早出现在AlexNet中）以及ResNet中的bottleneck结构的启发，设计了一种名为ShuffleNet的高效CNN模型，该模型使用的核心技巧是poi...

2019-10-15 18:32:29 256

原创 DenseNet论文总结

论文: Densely Connected Convolutional Networks 一、内容简述　　作者通过研究Stochastic depth训练方法和ResNet后受到启发，设计了一种名为DenseNet的模型，能够有效地抑制梯度消失，强化特征传播同时大幅地减少参数数量。在实验中DenseNet在CIFAR、SVHN和ImageNet数据集中取得了了当...

2019-10-15 17:59:24 399

原创深层网络的随机深度训练法

论文：Deep Networks with Stochastic Depth一、内容简述本文提出了一种名为Stochastic Depth的深层神经网络训练方法，文中的主要训练对象是ResNet，在不同数据集中的实验表明，这种训练方法可以有效地解决深层网络训练困难的问题，对模型精度和训练速度都有很大的提升，为今后的深层神经网络训练提供了很好的思路，作者之后提出...

2019-10-15 12:51:25 1148

原创 Inception-v3总结及部分Inception-v2原理讲解

论文：Rethinking the Inception Architecture for Computer Vision一、内容概括本文是Inception结构四篇中的第三篇，具体介绍了BN层论文附录中提到的Inception-v2结构，同时又提出了Inception-v3结构，最后构建了一个42层的深度神经网络模型。文中提出的卷积分解等方法为之后的CNN模型提供了一种新思路。经实验表明，经过...

2019-09-22 23:23:56 2139

原创显著性目标检测模型：EGNet 总结

论文：EGNet: Edge Guidance Network for Salient Object Detection一．主要内容概括本文提出了一种名为EGNet的网络结构来解决静态目标检测问题，它由边缘特征提取部分、显著性目标特征提取部分以及一对一的导向模块三部分构成，利用边缘特征帮助显著性目标特征定位目标，使目标的边界更加准确。在6个不同的数据集中与15种目前最好的方法进行对比，实验结...

2019-09-22 23:09:23 6037 1

原创 VGG模型总结

一．内容概括本文提出了经典的VGG模型用于图像分类任务，目前VGG16和VGG19仍然是最为常用的CNN模型，文章主要证明了深度对于神经网络的重要性，为今后的发展提供了一个很好的思路。二．贡献点1.成功构建了16层（13Conv+3FC）和19层（16Conv+3FC）的有效的网络结构。2.证明了深度对于神经网络来说是非常重要的。3在大型数据集ImageNet中训练得到的模型测试准确率...

2019-09-22 23:01:28 1471

原创 BN层论文总结

论文：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate ShiftMotivation题目中的Internal Covariate Shift指的是在训练过程中各层输入数据的分布随前一层网络参数的变化而变化的现象，这种现象会使训练深度神经网络变得更加复杂，需要耗费更多的时...

2019-09-18 11:10:05 2912

原创 GoogleNet Inception-v1论文总结

论文：Going deeper with convolutions一．主要内容文章主要构建了一种名为Inception的结构，是Inception四篇中的第一篇，使用Inception所构建的一个典型的22层的深层网络结构GoogLeNet获得了2014年ILSVRC的冠军，是当时最好的图像分类和检测方法。二．Motivation改善深层神经网络性能最简单的方法就是增加它的深度和宽度，但是...

2019-09-18 11:07:21 372

原创 CNN技巧论文总结

@CNN论文汇总（Inception1-4，GoogLeNet等持续更新）论文：Bag of Tricks for Image Classification with Convolutional Neural Networks一．主要内容：这篇文章主要对图像分类研究中训练方法的改进、模型微调（以ResNet为例）以及模型训练中的一些技巧做了一个汇总并且通过ablation study验证了这...

2019-09-18 11:06:20 663

zz937211040的博客