Hali_Botebie-CSDN博客

原创按关键字搜索自己的CSDN博客

搜索自己博客的功能在谷歌输入关键词，格式如下：<要检索的关键词> site:blog.csdn.net/<博客名>马氏距离 site:blog.csdn.net/djfjkj52

2020-02-28 19:38:15 272

原创【Transformer-BEV编码（6）】Sparse4D-V3: Sparse-based End-to-end Multi-view Temporal Perception

论文：https://arxiv.org/abs/2311.11722代码：https://github.com/HorizonRobotics/Sparse4D其他：https://zhuanlan.zhihu.com/p/637096473如果不看V1 和V2 是无法理解V3 的，因为V3只是改进了V2的一些东西。增加了去噪模块，质量评估模块和解耦头。其他的还得看V2 哟！

2024-04-23 11:25:04 713

原创【Transformer-BEV编码（7）】Sparse4D源代码，在mmdet里面增加cuda的插件deformable_aggregation

双线性插值的梯度更新原理基于链式法则，即在反向传播过程中，通过计算损失函数对插值结果的梯度，进一步求得插值过程中各参数（如输入数据、采样位置、权重等）的梯度。这个函数主要用于在图像处理中，当需要从一个浮点坐标获取像素值时，可以通过这个函数基于其最近的四个整数坐标上的像素值进行插值计算，从而得到一个估计值。的Kernel，并传递给它相关的数据和参数。，bilinear_sampling 用于推理过程中的计算，在训练过程中，需要保证这个经过双线性插值后，权重依然可以被更新，因此需要写相关的代码。

2024-04-22 16:43:19 636

原创【QT开发（18）】QT for android，安卓手机蓝牙遥控器，用来控制遥控车

因为云端配置了QT for android，没有其他开发安卓的IDE，本着简单事情简单办的原则，在QT 上开发，还可以跨平台部署，很好啊。界面划分为三个 QWidget，伸展因子（Stretch Factor）比例分别是3：2：6.例如左边的标度盘是15，右边刻度盘是50，串口发送。发送左右两个标度盘的数值（范围：10-99），在。发送前进、后退、暂停等串口指令分别发送。2、蓝牙QT for android。3、公众号：果果小师弟出品，蓝牙小车。接受其他蓝牙发送过来的串口信息。蓝牙打开、搜索和连接。

2024-04-18 09:24:28 257

原创【数据集（2）】A Survey on Autonomous Driving Datasets: Data Statistic, Annotation, and Outlook

0.论文信息标题：A Survey on Autonomous Driving Datasets: Data Statistic, Annotation, and Outlook作者：Mingyu Liu, Ekim Yurtsever, Xingcheng Zhou, Jonathan Fossaert, Yuning Cui, Bare Luka Zagar, Alois C. Knoll机构：TUM、俄亥俄州立大学原文链接：https://arxiv.org/abs/2401.01454。

2024-04-12 20:39:21 109

原创【Transformer-BEV编码器(5)】CVPR2023 AeDet: Azimuth-invariant Multi-view 3D Object Detection

LSS 的多视角3D 中，因为忽略了辐射（径向方向）对称性，导致优化困难。为了保留 BEV 特征的固有属性并简化优化，我们提出了方位角等变卷积（AeConv）和方位角等变锚点。AeConv 采用的网格是在辐射方向，因此它能学习到方位角不变性的BEV 特征。提出的anchor 可以开启检测头去学习预测方位角相关性的目标。另外，我们引入了相机解耦虚拟深度去统一深度预测（不同相机内参的图片）。大幅超越了最近的多视图 3D 物体检测器，例如 PETRv2 和 BEVDepth。

2024-04-12 20:19:56 518

转载【Vector-Map-路径规划（C1）】Open Planner 工程-论文Open Source Integrated Planner for Autonomous Navigation

Global Planner处理路径规划。vector map 矢量地图start position 起点goal position 终点输出：最短，最少cost的路径支持复杂的vector map，但这篇论文里用的是简单的。全局规划器处理路径路由。该算法以矢量地图、起始位置和目标位置为输入，利用动态规划方法寻找最短或最低成本路径。

2024-04-11 17:42:58 10

原创【Vector-Map-路径规划（0）】卷首语

我基于论文《VectorMapNet: End-to-end Vectorized HD Map Learning 》的输出来看，论文中说，在矢量地图中，我们表征地图元素作为一系列的几何线，它们是容易去连接下游任务的，例如运动预测，编码这些几何线与一系列的预测任务。输出包括道路边沿，车道线和人行横道。看图片右边的情况，经过Polyline Generator 后，输出Polyline。这是由关键点+类别组成的。这就和车道线的关键点检测方法有点类似了。

2024-04-11 16:59:47 920

原创【Head-DETR系列（3）】2023CVPR最佳论文奖：UniAD: Planning-oriented Autonomous Driving 规划导向的自动驾驶

现代自动驾驶系统的特点是将任务按顺序模块化，即感知、预测和规划。要么为单个任务部署独立的模型，要么用不同的head 设计一个多任务任务网络。他们可能会遭受累积错误AE或缺乏任务协调deficient task coordination。相反，我们认为，为了追求最终目标，即自动驾驶汽车的规划(planning of the self-driving car)，应该设计和优化一个有利的框架。

2024-04-10 23:13:39 964

原创【Transformer-BEV编码器(5)】CVPR2023 时空BEV金字塔：TBP-Former: Learning Temporal Bird’s-Eye-View Pyramid

以视觉为中心的联合感知和预测（PnP）成为自动驾驶研究的新兴趋势。我们提出了一种用于以视觉为中心的 PnP 的时间鸟瞰金字塔变换器（TBPFormer），其中包括两种新颖的设计。首先，提出了一种姿态同步的 BEV 编码器，可以随时将具有任何相机姿态的原始图像输入映射到共享且同步的 BEV 空间，以实现更好的时空同步。其次，引入时空金字塔变换器来全面提取多尺度 BEV 特征，并在空间先验的支持下预测未来的 BEV 状态。

2024-04-10 22:53:01 844

原创【Transformer-BEV编码器(4)】CVPR2023丰田研究院Viewpoint Equivariance for Multi-View 3D Object Detection -视点等变化

BEV 作为cornerstone capability ，非常重要。多视图一致性multi-view consistenc——> 3D 场景理解和几何学习——> 利用 3D multi-view geometry+ 通过viewpoint equivariance ——>改进定位。利用 query-base 的transformer 架构和 3D 场景进行编码（通过使用来自 3D 透视几何的位置编码来增强图像特征）。我们在输出级别设计，这使得能够在训练期间生成多个虚拟帧，以通过强制来学习。

2024-04-09 14:33:16 946

原创【迅为iTOP-4412-linux 系统制作（4）】ADB 或者 TF 卡烧写测试

编译生成的内核镜像uImage 和设备树 dtb 文件“exynos4412-itop-elite.dtb”已经可以使用了。

2024-04-08 17:29:18 764

转载【迅为iTOP-4412-linux 系统制作（3）】根文件系统移植-Ubuntu 20

大家不要看着ubuntu就怕了，其实移植里面ubuntu是相对最简单，步骤最少的了。Ubuntu官方针对不同的CPU架构提供相应的ubuntu base根文件系统，有amd64(64位X86)、armhf、i386(32位X86)、powerpc、ppc64el等，我们只需要修改下相关配置下即可放到板子上运行。下面是移植好的仓库地址，https://github.com/jason416/ubuntu-base-20一、下载ubuntu-base。

2024-04-08 17:22:20 10

转载【迅为iTOP-4412-linux 系统制作（2）】根文件系统移植-BusyBox

文件系统是一个用来组织和管理文件的系统，有了文件系统之后，就可以轻松操作存储在存储介质上的文件，比如文件的增、删、查、改等基本操作。文件系统的格式有很多种（fat32、ext2、ext3、ntfs等）。根文件系统：最顶端称为根，在Linux上用“ \ ”表示，然后将一个按照特定目录组成的文件系统挂载到根上，这个系统就叫做根文件系统。Busybox是一个集成大量Linux命令的工具，例如ls,cat,cp等命令，使用busybox可以很容易构建出根文件系统需要的。

2024-04-08 17:21:44 12

原创【迅为iTOP-4412-linux 系统制作（1）】linux内核移植-5.4并适配设备树

服务器：Ubuntu 18目标开发板CPU (Exynos4412，四核Cortex-A9，主频为1.4GHz-1.6GHz)RAM (1GB 双通道 DDR3)内核代码下载Note:移植好的源码见github仓库的iTop4412分支。

2024-04-08 17:08:03 895

原创【迅为iTOP-4412 linux系统制作（0）】卷首语

17年买的4412 开发板，最近想花半天时间来把“linux系统“重新部署一遍，毕竟都2024年了。当初为啥买 4412？因为，4412是三星的经典处理器。2017 年 6 月份左右，迅为电子 iTOP 系列开发平台 iTOP-4412 的 SCP 核心板，得到开源软件 Linux 的官方支持，这意味着从linux官方 www.kernel.orrg下载的更新内核稍加修改就可以直接在 ITOP4412 上运行。

2024-04-08 14:08:16 173

原创【相机方案】智能驾驶的域控采用的“串行器和解串器”方案的总结（持续更新），SerDes，GMSL

SerDes是Serializer/Deserializer的缩写，即串行器和解串器。由于同轴线的传输延迟几乎可以忽略不计（ns级别），相当于将原来只能短距离传输的高速并行信号(MIPI/I2C/CLK等)的传输距离延长，真正做到高带宽、低延迟、长距离的数据传输。

2024-04-08 12:23:15 866

原创【Attention(0)】卷首语，从“SEAttention注意力效果秒杀CBAM”聊到“Transformer”

Attention 注意力是一个非常有价值的机制，例如我们耳熟能详的。我们常常看到这样的标题。其实，CBAM 是一种“卷积神经网络注意力模块”(Convolutional Block Attention Module, CBAM)。这也是一篇论文《CBAM: Convolutional Block Attention Module》。CBAM旨在自动学习输入特征图的空间和通道注意力权重，从而更好地捕捉图像中的局部信息和全局上下文。CBAM包括两个主要组成部分: 空间注意力模块和通道注意力模块。

2024-04-07 15:47:47 573

原创【Transformer-BEV编码器(3)】BEVFormer v2: Adapting Modern Image Backbones to Bird’s-Eye-View Recognition

现有的最先进的BEV检测器通常与VOVnet等深度预训练主干网有关，阻碍了蓬勃发展的图像主干网和BEV检测器之间的协同作用。为了解决这一限制，我们通过引入透视图监控，优先考虑简化BEV探测器的优化1、作者提出了典型的BEV模型的工作流程2、作者说大家关注视觉转换模块和下游任务，但是对于 backbone 的关注缺乏。作为一个前沿和高需求领域，自然会将现代图像主干引入自动驾驶。令人惊讶的是，研究界选择坚持使用VOVnet[13]，以享受其大规模深度培训前[26]。

2024-04-03 15:06:58 862

原创【透视图像目标检测（0）】卷首语

其实，透视图像目标检测很早就开始研究了，在博客笔记里面也躺了很多的坑没填，这个领域是一个很重要的领域，特别是在BEVFormerv2 使用透视监督后，透视的算法也又有应用的新地方了。把个人理解的脉络梳理出来，供大家参考，欢迎指正！

2024-04-02 15:50:11 1303

转载 pybind11混合CUDA+Python+C++编程

在cu文件里写如下代码，注意头文件包括头文件cuh里写这个，注意必须写上 __declspec(dllexport) ，不然生成的lib文件里没有该函数。

2024-04-01 17:09:33 7

原创【C++学习（27）】一个c++类的实例“多线程“运行的例子

一个类本身并不直接“用于多线程运行”。但是，类的实例（即对象）可以在多线程环境中被使用，并且类的设计可以影响它在多线程环境中的表现和易用性。在多线程编程中，重要的是要理解线程安全和并发控制的概念。线程安全意味着类的实例可以在多个线程中同时访问而不会导致数据不一致或其他问题。要设计一个线程安全的类，通常需要考虑如何同步对共享资源的访问，以避免竞态条件（race conditions）和其他并发问题。此外，一些设计模式（如单例模式、观察者模式等）在多线程环境中使用时需要特别注意线程安全性。

2024-04-01 15:51:35 246

转载【C++学习（26）】RAII + 接口模式对生产者消费者模型进行封装

本次课程学习了 RAII 接口模式下的生产者消费者多 batch 实现。把前面学的知识全都串起来了，首先通过 create_infer 创建 infer 资源并对模型进行加载，这是 RAII 体现，其次该函数返回的是接口类的智能指针，因此用户只能看到 forward 这一个接口，这是接口模式的应用。

2024-03-29 17:11:28 9

转载【C++学习（25）】RAII+接口模式对代码进行有效封装

这次课程我们学习了 RAII + 接口模式对代码进行封装，我们模拟了一个非常常见的推理类，首先我们分析了其存在的问题，那就是实例化 Infer 类，去调用 load_model、forward 等函数时，需要在函数去写异常逻辑处理，非常让人头疼。我们首先通过 RAII 将资源在构造函数中就进行初始化，避免了外部获取资源后还要调用相关函数去做初始化，其次我们采取了接口模式，将接口纯虚类与具体实现类分离开，让使用者只考虑具体的接口，而不必关心具体的实现。

2024-03-29 17:09:33 11

转载 BEV超视距的范围内，增加一个原本传统的算法，用2D算法去跟踪更加远的物体，但是当它进入到了BEV体系之后，我们可以在几何上做变换，认为它是同一个物体。

如果假设有无限的、准确的结构化数据，确实是不需要激光雷达，可以快速的训练出来一个模型，这个模型因为数据量很大，可以无限接近激光雷达的精度，但因为现在我们的所得到的数据量有限，我们就想又想要得到一个不错效果的车，那么激光雷达放进来，它就是一个好又快、显性度高的补充。成本会增加，难度是在变，大成本是在增加。那么在持续性这个层面，传统车厂要去克服体制的原因，这个情况就是说，我们需要有会做决定的人，他知道要持续的、不断为这个事情，为训练数据收集数据形成数据闭环，去不断的优化算法，这个事情要持续的迭代和升级。

2024-03-29 11:06:35 7

空空如也

空空如也