自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (1)
  • 问答 (2)
  • 收藏
  • 关注

原创 程序员如何提供工作效率--工具篇

如果你熟悉键盘的历史,你会知道键盘的布局并不是最优的,键盘的布局从打字机诞生到现在,几乎没有任何改动。我这里推荐一本书《vim的实用技巧》,我看了之后可以用醍醐灌顶来形容,当我不熟悉 vim 的时候觉得 vim 的使用方式是完全反人类的,当我看过这本书之后,我对 vim 简直爱不释手,从此之后使用 vim 编辑代码,优雅的仿佛是在弹钢琴。也许看完后,你觉得这里的每一条建议作用都不大,但是时间就是这样一点一点省出来的,日复一日,积少成多,能从繁重的工作中腾出更多的时间来思考,这才是最关键的。

2023-09-30 10:18:29 162

原创 BEVFormer: Learning Bird‘s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Trans

BEVFormer 论文解读

2023-08-13 21:04:17 146

原创 MapTR论文笔记

本文的主要贡献主要有两点:1. 对于地图元素的统一表示2. 针对这种统一表示给出了 一个端到端学习的网络结构

2023-08-06 17:22:31 1704

原创 BEVDet 论文解读

2D 的视觉感知在过去的几年里有了急速的发展,涌现出一些优秀的范式工作,这些工作有较高的性能,可扩展性,以及多任务的兼容性(比如 Mask R-CNN)。但是在自动驾驶感知领域,最新的一些 benchmarks 还是有很多不同的范式。比如在 nusences 数据集上,就有一些 基于图像的方法,比如 FCOS3D,PGD等,还有一些基于 BEV 的方法,比如 PON,LSS,VPN。因此本文提出了 BEVDet,尝试以一种统一的框架解决不同的任务。

2023-07-23 16:57:57 284

原创 PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images

3D 的 Lane head 会预测 lane 的 类别 以及 相对于 x 轴 和 Z 轴的偏移量。首先将 t-1 帧 和 t 帧 的 相机坐标系下的3D点集 投影到 雷达坐标系,然后 使用全局坐标系 作为桥梁 ,将 t-1帧雷达坐标系下的 3D点集 投影到 t 帧的 雷达坐标系下。PETR 中的 3D 坐标 到 3D 位置编码的 过程是 数据无关的。目的是将 t-1 帧的 3D 坐标 变换到 t 帧的 3D 坐标系统。对其之后的 t 帧 和 t-1帧的 点集 会被用于 生成 3D PE。

2023-07-15 17:19:26 1301

原创 PETR: Position Embedding Transformation for Multi-View 3D Object Detection

以及该网络生成的是 3D 空间下的坐标点,这样可以保证网络的收敛,本文尝试了 DETR 中的设置,或者生成 BEV 下的 anchor poitns 都不能保证收敛。和 DGSN 论文相同,首先 离散 相机视锥空间 生成一个 网格(shape : W_F, H_F, d),然后可以用一个 变换矩阵 将 坐标 转换到 3D 坐标,3D 空间的 是 所有 view 的相机共享的。为了建立起 2D 图像 和 3D 空间的联系,将 相机视锥空间的点 投影到 3D 空间,因为这两个空间的点 是 一一对应的。

2023-07-15 17:14:33 2852

原创 The 1st-place Solution for CVPR 2023 OpenLane Topology in Autonomous Driving Challenge

CVPR 2023 openlane 拓扑比赛第一名解决方案:openLane 的四个子任务:中心线检测,交通元素检测,中心线和中心线的 拓扑,中心线 和 交通元素的拓扑 预测使用 PETRv2 检测中心线,YOLOv8 检测交通元素,设计了一个简单有效的 基于 mlp 的 head 用于 拓扑预测。

2023-07-15 16:58:43 194

原创 DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries

本文提出了一个 仅使用 2D 信息的,3D 目标检测网络,并且比依赖与 密集的深度预测 或者 3D 重建的过程。类似于 DETR 的 set to set 的 loss,在 decoder 的每一个 layer 后面都有 loss 的计算。长久以来 3D目标检测是一个挑战,并且 仅使用 2D 的图像信息(RGB图像),相比于 3D 信息(LiDAR)更加困难。本文提出了一个更加优雅的 2D 观察到 3D预测的过渡,用于自动驾驶任务,该方法不依赖于 密集的深度预测模块。

2023-07-15 12:09:25 981

原创 softmax 反向传播 代码 python 实现

可以看到,softmax 计算了多个神经元的输入,在反向传播求导时,需要考虑对不同神经元的参数求导。

2023-04-08 18:14:35 499

原创 手撕/手写/自己实现 BN层/batch norm/BatchNormalization python torch pytorch

在卷积神经网络中,BN 层输入的特征图维度是 (N,C,H,W), 输出的特征图维度也是 (N,C,H,W)N 代表 batch sizeC 代表 通道数H 代表 特征图的高W 代表 特征图的宽我们需要在通道维度上做 batch normalization,在一个 batch 中,使用 所有特征图 相同位置上的 channel 的 所有元素,计算 均值和方差,然后用计算出来的 均值和 方差,更新对应特征图上的 channel , 生成新的特征图如下图所示:对于4个橘色的特征图,计算所有元

2023-04-08 15:33:03 1632 1

原创 vscode 关闭/忽略/ignore 单个/指定 git 仓库/repository 提示

vscode 当打开的项目中有多个 git 仓库时,默认会显示所有仓库的 status。如果直接关闭 vscode 的 git 提示功能,则会影响到我们正在使用的 git 仓库,所以需要单独关闭特定的 git 仓库的提示。或者直接点击 左下角 管理 -> 设置,搜索 ignoredRepositories,添加你想忽略的仓库路径。修改配置文件 .vscode/setting.json,添加下面的配置。修改配置文件 .vscode/setting.json,添加下面的配置。

2022-12-10 17:41:58 5834

原创 Pytorch的nn.DataParallel 多 GPU 训练 只用到单个GPU/只用到一个GPU/不起作用

最近尝试使用 pytorch 的 nn.DataParallel 进行多 GPU 训练。按照官方文档修改代码后发现只使用了一块 GPU,最后经过查阅论坛,找到了原因。这里总结一下,希望能帮到大家。顺便一提 pytorch 官网推荐使用 DistributedDataParallel 进行多 GPU 训练,而这篇博客只是分享一些问题的原因。nn.DataParallel 原理简述:在前向传播过程中,将输入的 batch 平均分配到用户指定的 GPU 中,每个 GPU 中有一份 module 的副本,每个

2021-05-19 22:16:11 8352 6

原创 MySQL 8.0 GUI 编辑 数据错误:Refresh Recordset There are pending changes. Please commit or rollback first

使用 MySQL Workbench 8.0先查询了某张表中的数据打算手动添加一行数据,输入完成后点击 上方的 刷新按钮(上图中红色圈内的按钮),结果出现错误:07:55:48 Refresh Recordset There are pending changes. Please commit or rollback first.解决方法原来是编辑了数据还未保存,点击 apply 按钮...

2020-03-20 08:28:32 3309

原创 FPN YOLOv3 Faster R-CNN PR 曲线 Precision-Recall 曲线 绘制

本文所使用的代码库:FPN:https://github.com/DetectionTeamUCAS/FPN_TensorflowYOLOv3:https://github.com/ultralytics/yolov3Faster R-CNN:https://github.com/jwyang/faster-rcnn.pytorch之前研究了半天,解决之后才发现很简单。。。方法:其实大...

2020-01-10 18:28:51 4345 19

原创 (新手向)keras resnet 训练自己的数据集 图像分类

使用 keras 中的 resnet 模型来进行图像分类其实很简单,比较麻烦的问题在于处理数据集的部分。这里先把大概的框架讲一下,最后再说数据集的处理。导入各种python库首先要导入各种库import os,sysimport numpy as npimport scipyfrom scipy import ndimageimport tensorflow as tfimport...

2019-08-23 15:09:23 27049 95

原创 Microsoft Visual c++ 2019 MinimumRuntime 和 vc_runtimeminimum_x86.msi 安装出现的问题

博主在安装 Visual Studio 2019 community 版本的时候电脑出现了蓝屏,重启电脑后继续安装出现了问题##解决方法:##

2019-07-11 15:58:21 52048 7

原创 基于 Mask R-CNN 的鸟类识别 app

一个基于 Mask R-CNN 的鸟类识别 APP,可以识别五种鸟类,mAP 83%。前言这时博主的毕设的课题,时间紧迫加上自身能力所限,最后的作品还有很多不足,还望各位不吝指正。代码已经上传到了 github,并附上了详细的使用说明。先放一下效果图概述整个系统包括用户端和服务端两部分。用户端通过 http 协议将待识别的鸟类图片上传到服务端,服务端再将识别后的图片和鸟类信息返回给...

2019-05-25 19:33:49 4018 3

原创 机器学习_吴恩达_作业_中文_python_ex1

机器学习_吴恩达_作业_中文_python_ex1单变量线性回归绘制数据图像梯度下降更新方程实现计算代价函数梯度下降可视化 J($\theta$)完整代码单变量线性回归个人blog https://verbf.github.io在这部分的练习中,你将使用单变量的线性回归来预测食品卡车的利润。假设你是a公司的CEO并正在考虑在不同的城市开设一家连锁餐厅。该连锁店已经在多个城市拥有卡车,并且你拥...

2019-05-01 14:53:17 1543

原创 机器学习笔记(吴恩达)(二)--多变量线性回归

机器学习笔记(吴恩达)(二)--多变量线性回归场景描述假设函数代价函数梯度下降特征缩放(Feature Scaling)均值归一化(Mean normalization)多项式回归特征选择拟合多项式检验方法学习率选择正规方程正规方程与梯度下降法比较本篇介绍了有关在多特征的情况下如何使用线性回归,以及一些相关的技巧。场景描述在多数时候我们的特征并不会只有一个。在预测房价的例子中,除了房屋的面...

2019-04-30 09:21:11 765

原创 机器学习笔记(吴恩达)(一)--单变量线性回归

机器学习笔记(吴恩达)(一)--单变量线性回归场景描述概念介绍假设函数代价函数代价函数详解代价函数与参数$\Theta$的关系梯度下降法个人blog https://verbf.github.io/场景描述我们有关于房屋面积和房屋价格的数据集,现在想拟合一条直线通过房屋的面积来预测房屋价格。这条直线应该尽可能的符合已有的数据。概念介绍假设函数这里我们简单的假设该直线的方程为h(x)=...

2019-04-30 09:14:24 292

java json 所需的6个包

java 操作json对象所需的六个jar包 , 命名空间为net.sf

2018-06-19

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除