SugerOO-CSDN博客

原创程序员如何提供工作效率--工具篇

如果你熟悉键盘的历史，你会知道键盘的布局并不是最优的，键盘的布局从打字机诞生到现在，几乎没有任何改动。我这里推荐一本书《vim的实用技巧》，我看了之后可以用醍醐灌顶来形容，当我不熟悉 vim 的时候觉得 vim 的使用方式是完全反人类的，当我看过这本书之后，我对 vim 简直爱不释手，从此之后使用 vim 编辑代码，优雅的仿佛是在弹钢琴。也许看完后，你觉得这里的每一条建议作用都不大，但是时间就是这样一点一点省出来的，日复一日，积少成多，能从繁重的工作中腾出更多的时间来思考，这才是最关键的。

2023-09-30 10:18:29 162

原创 BEVFormer: Learning Bird‘s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Trans

BEVFormer 论文解读

2023-08-13 21:04:17 146

原创 MapTR论文笔记

本文的主要贡献主要有两点：1. 对于地图元素的统一表示2. 针对这种统一表示给出了一个端到端学习的网络结构

2023-08-06 17:22:31 1704

原创 BEVDet 论文解读

2D 的视觉感知在过去的几年里有了急速的发展，涌现出一些优秀的范式工作，这些工作有较高的性能，可扩展性，以及多任务的兼容性（比如 Mask R-CNN）。但是在自动驾驶感知领域，最新的一些 benchmarks 还是有很多不同的范式。比如在 nusences 数据集上，就有一些基于图像的方法，比如 FCOS3D，PGD等，还有一些基于 BEV 的方法，比如 PON，LSS，VPN。因此本文提出了 BEVDet，尝试以一种统一的框架解决不同的任务。

2023-07-23 16:57:57 284

原创 PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images

3D 的 Lane head 会预测 lane 的类别以及相对于 x 轴和 Z 轴的偏移量。首先将 t-1 帧和 t 帧的相机坐标系下的3D点集投影到雷达坐标系，然后使用全局坐标系作为桥梁，将 t-1帧雷达坐标系下的 3D点集投影到 t 帧的雷达坐标系下。PETR 中的 3D 坐标到 3D 位置编码的过程是数据无关的。目的是将 t-1 帧的 3D 坐标变换到 t 帧的 3D 坐标系统。对其之后的 t 帧和 t-1帧的点集会被用于生成 3D PE。

2023-07-15 17:19:26 1301

原创 PETR: Position Embedding Transformation for Multi-View 3D Object Detection

以及该网络生成的是 3D 空间下的坐标点，这样可以保证网络的收敛，本文尝试了 DETR 中的设置，或者生成 BEV 下的 anchor poitns 都不能保证收敛。和 DGSN 论文相同，首先离散相机视锥空间生成一个网格（shape : W_F, H_F, d），然后可以用一个变换矩阵将坐标转换到 3D 坐标，3D 空间的是所有 view 的相机共享的。为了建立起 2D 图像和 3D 空间的联系，将相机视锥空间的点投影到 3D 空间，因为这两个空间的点是一一对应的。

2023-07-15 17:14:33 2852

原创 The 1st-place Solution for CVPR 2023 OpenLane Topology in Autonomous Driving Challenge

CVPR 2023 openlane 拓扑比赛第一名解决方案：openLane 的四个子任务：中心线检测，交通元素检测，中心线和中心线的拓扑，中心线和交通元素的拓扑预测使用 PETRv2 检测中心线，YOLOv8 检测交通元素，设计了一个简单有效的基于 mlp 的 head 用于拓扑预测。

2023-07-15 16:58:43 194

原创 DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries

本文提出了一个仅使用 2D 信息的，3D 目标检测网络，并且比依赖与密集的深度预测或者 3D 重建的过程。类似于 DETR 的 set to set 的 loss，在 decoder 的每一个 layer 后面都有 loss 的计算。长久以来 3D目标检测是一个挑战，并且仅使用 2D 的图像信息（RGB图像），相比于 3D 信息（LiDAR）更加困难。本文提出了一个更加优雅的 2D 观察到 3D预测的过渡，用于自动驾驶任务，该方法不依赖于密集的深度预测模块。

2023-07-15 12:09:25 981

原创 softmax 反向传播代码 python 实现

可以看到，softmax 计算了多个神经元的输入，在反向传播求导时，需要考虑对不同神经元的参数求导。

2023-04-08 18:14:35 499

原创手撕/手写/自己实现 BN层/batch norm/BatchNormalization python torch pytorch

在卷积神经网络中，BN 层输入的特征图维度是（N,C,H,W）, 输出的特征图维度也是（N,C,H,W）N 代表 batch sizeC 代表通道数H 代表特征图的高W 代表特征图的宽我们需要在通道维度上做 batch normalization，在一个 batch 中，使用所有特征图相同位置上的 channel 的所有元素，计算均值和方差，然后用计算出来的均值和方差，更新对应特征图上的 channel ，生成新的特征图如下图所示：对于4个橘色的特征图，计算所有元

2023-04-08 15:33:03 1632 1

原创 vscode 关闭/忽略/ignore 单个/指定 git 仓库/repository 提示

vscode 当打开的项目中有多个 git 仓库时，默认会显示所有仓库的 status。如果直接关闭 vscode 的 git 提示功能，则会影响到我们正在使用的 git 仓库，所以需要单独关闭特定的 git 仓库的提示。或者直接点击左下角管理 -> 设置，搜索 ignoredRepositories，添加你想忽略的仓库路径。修改配置文件 .vscode/setting.json，添加下面的配置。修改配置文件 .vscode/setting.json，添加下面的配置。

2022-12-10 17:41:58 5834

原创 Pytorch的nn.DataParallel 多 GPU 训练只用到单个GPU/只用到一个GPU/不起作用

最近尝试使用 pytorch 的 nn.DataParallel 进行多 GPU 训练。按照官方文档修改代码后发现只使用了一块 GPU，最后经过查阅论坛，找到了原因。这里总结一下，希望能帮到大家。顺便一提 pytorch 官网推荐使用 DistributedDataParallel 进行多 GPU 训练，而这篇博客只是分享一些问题的原因。nn.DataParallel 原理简述：在前向传播过程中，将输入的 batch 平均分配到用户指定的 GPU 中，每个 GPU 中有一份 module 的副本，每个

2021-05-19 22:16:11 8352 6

SugerOO的博客

原创程序员如何提供工作效率--工具篇

原创 BEVFormer: Learning Bird‘s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Trans

原创 MapTR论文笔记

原创 BEVDet 论文解读

原创 PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images

原创 PETR: Position Embedding Transformation for Multi-View 3D Object Detection

原创 The 1st-place Solution for CVPR 2023 OpenLane Topology in Autonomous Driving Challenge

原创 DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries

原创 softmax 反向传播代码 python 实现

原创手撕/手写/自己实现 BN层/batch norm/BatchNormalization python torch pytorch

原创 vscode 关闭/忽略/ignore 单个/指定 git 仓库/repository 提示

原创 Pytorch的nn.DataParallel 多 GPU 训练只用到单个GPU/只用到一个GPU/不起作用

原创 MySQL 8.0 GUI 编辑数据错误：Refresh Recordset There are pending changes. Please commit or rollback first

原创 FPN YOLOv3 Faster R-CNN PR 曲线 Precision-Recall 曲线绘制

原创（新手向）keras resnet 训练自己的数据集图像分类

原创 Microsoft Visual c++ 2019 MinimumRuntime 和 vc_runtimeminimum_x86.msi 安装出现的问题

原创基于 Mask R-CNN 的鸟类识别 app

原创机器学习_吴恩达_作业_中文_python_ex1

原创机器学习笔记(吴恩达)(二)--多变量线性回归

原创机器学习笔记(吴恩达)(一)--单变量线性回归

java json 所需的6个包

win10 Anaconda python 中 SSL模块无法正常使用

sql语句在 sql server 下可正确执行，在qt下执行后无结果？