自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(226)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 2023最新SLAM面试题汇总(持续更新中)

目前机器人SLAM问题是一个非常值得研究的方向,在未知环境中,首先要通过SLAM技术获得环境的地图,然后才能进行导航。这个方向是近几年比较新的研究方向,相关的机器人公司以及研究机器人的大厂也很需要SLAM方向的人才。...

2022-07-20 19:12:20 4803 4

原创 FSGS:少视图输入的实时3D-GS新方法

FSGS只需3张输入图像就可以生成逼真的新视角图像,并以超过200帧/秒的速度执行推理过程,为实时渲染等任务提供了更加节省成本与快速的方法。

2024-03-22 11:21:59 617

原创 具身感知的数据基本预处理|惯视跨模态时序对齐系列(一)

本文将根据惯视里程计中的时序对齐进行总结和讨论。

2024-03-21 10:21:16 932

原创 MIT提出最新时空语义SLAM框架:Khronos

MIT团队提出一个解决语义度量化的同时定位与建图问题的系统框架Khronos,可以解释长期短期的动态变化,并且能够实时构建密集的时空地图。真实环境会经历短期和长期的变化,而当前的研究都没有对这两种变化进行推理的统一方法。

2024-03-19 15:51:10 641

原创 激光雷达全局定位综述:挑战、进展和开放问题

本项调研旨在整合激光雷达全局定位现有的最先进技术,同时确定未来的研究问题。

2024-03-18 10:53:34 793

原创 入选CVPR2024:SNI-SLAM,融合外观、几何和语义的神经隐式SLAM

本文是发布在CVPR 2024的论文,提出了SNI-SLAM:一个利用神经隐式表示的语义SLAM系统,它能够同时执行准确的语义建图、高质量的表面重建和稳健的相机跟踪。

2024-03-15 11:17:13 986

原创 高精度多传感融合SLAM SOTA:可直接用于导航探索的实时地图

本文提出了一种包括激光雷达、视觉传感器、惯性传感器三者在内的SLAM系统。

2024-03-14 12:08:51 769

原创 实时目标检测新SOTA-YOLOv9问世

本文提出采用PGI来解决信息瓶颈问题以及深度监督机制不适用于轻量级神经网络的问题。

2024-03-13 10:43:17 690

原创 LOGICHOI:融合神经计算与符号推理,革新人-物交互检测

相较于传统的视觉感知任务,如object或单个action的识别,HOI检测更注重实体推理,因此在图像合成、视觉问题解答和标题生成等场景理解任务中具有广泛应用。

2024-03-12 12:13:13 868

原创 VOOM:面向目标的SLAM方法再升级?

本文提出了一种新的视觉目标里程计和建图框架VOOM,以由粗到精的方式将高级目标和低级特征点作为分层路标,并且验证了相比于面向目标的SLAM和特征点SLAM系统的定位性能。

2024-03-11 16:05:33 906

原创 Mamba模型底层技术详解,与Transformer到底有何不同?

Mamba模型在CV等领域的扩展应用,在未来可能会井喷式出现。

2024-03-06 14:45:33 1380

原创 通用操作接口UMI:如何快速简单地给机器人提供更多学习数据?

斯坦福团队提出通用操纵接口(UMI)通用框架,可以直接从人类演示中学习有能力且可泛化的操纵策略。该项工作解决了机器人训练中“先有鸡还是先有蛋”的难题。。

2024-03-04 12:01:07 826

原创 掌握线性状态空间:从零构建一个Mamba神经网络架构

Mamba 是一个线性时间序列建模框架,旨在提高序列建模的效率和有效性。本文将深入探讨使用 PyTorch 实现 Mamba 的过程,讨论这一创新方法背后的技术问题和代码。

2024-03-01 18:26:52 1216 1

原创 首个基于地面纹理的单目SLAM,复杂光照环境中也能精准定位

本文介绍了一种无需事先构建地图即可实时在线SLAM的解决方案。通过使用朝下的单目相机捕获地面纹理图像,即使在环境特征稀疏或光照条件复杂的情况下也能提供可靠的定位信息。

2024-02-29 14:32:40 580

原创 最新类脑模型M-Detector:首个登上Nature的动态点云流检测架构

本文提出了一种类脑模型M-Detector,用于点级别的动态环境检测。M-Detector基于遮挡原理,模仿视觉巨细胞的工作机理,实现了高性能且低开销的点级别动态点云流检测,可应用于高动态避障以及高精建图等各种任务。

2024-02-28 11:02:15 802

原创 MARC:一种安全又高效的时空联合规划的方法

本文提出的MARC算法,结合了多策略的场景树和风险感知的Contingency Planning的优点, 考虑了风险等级的容忍度和不确定性来生成安全且互动性的驾驶行为。它的主要特点是场景和规划都是基于树结构,并且能够充分利用到多策略和多模式信息,使得获得的最优策略是针对所有场景的最优结果。

2024-02-27 11:09:59 1237

原创 不需要COLMAP的3DGS投影?

CF-3DGS是一个端到端的框架,可以从图像序列中联合估计相机姿态和新视角合成。借助高斯投影的优势,该方法可实现快速训练和推理。

2024-02-26 18:44:05 705

原创 最新研究iTransformer: Transformer不适合多变量时序预测?

iTransformer是2024年时间序列预测领域的最新研究成果,目前在标准时间序列预测数据集上展现出SOTA。

2024-02-23 11:25:19 1242

原创 VirtualPainting:新一代多传感器融合方案,大幅提升3D目标检测性能

本文提出了一种新颖的方法,它利用图像生成LiDAR虚拟点,通过基于图像的分割网络提供的语义标签来增强这些虚拟点,从而克服点云的稀疏性问题,提高了对稀疏分布对象的检测能力,有效解决了自动驾驶领域的一大痛点。

2024-02-22 12:03:40 980

原创 SA-GS:在3D高斯抛雪球中实现SAM任意物体分割

大量的分割实验表明,SA-GS可以有效地在三维高斯中获得高质量的物体分割结果,从而可以轻松地应用于场景编辑和碰撞检测任务。

2024-02-07 10:37:46 715

原创 最新模型VMamba:颠覆视觉Transformer,下一代主流Backbone?

卷积神经网络(CNN)与视觉Transformer(ViT)是目前最流行的两种视觉表征基础模型。CNN在线性复杂度下,具有惊人的可扩展性。ViTs在性能方面超过了CNN,但是其具有平方复杂度。经深入分析,ViT具有更加强大性能的原因在于:它利用了全局的感受野和动态的权重分配方法。因此,一种既具有ViT全局感知优势,又具有高计算效率的框架需要被提出。受到状态空间模型启发,我们提出了视觉状态空间模型(VMamba),这个模型能够在不破坏全局感受野的前提下,达到线性的计算复杂度。

2024-02-06 10:07:21 2294

原创 一年发3篇TRO的“刺头”是怎样炼成的?

做科研就是要相信自己。

2024-02-05 11:01:12 830

原创 InverseMatrixVT3D:简单高效实现三维占用预测模型!

本方法不需要基于Transformer的查询或深度估计,这使得3D体积生成过程简单又高效。

2024-02-04 10:33:38 871

原创 说话人脸合成新框架NeRF-AD,使图像生成质量和嘴型同步提升

该框架在NeRF中加入了基于注意力的解耦模块。

2024-02-02 14:22:34 844

原创 从0开始用 PyTorch 构建完整的 NeRF

本文简述了NeRF实现的算法流程和相关数据集和参数的设定。

2024-02-01 10:38:50 961

原创 Adobe又一力作:无位姿稀疏视图即可重建3D大模型?

目前该模型在姿态预测精度和重建质量方面大大优于基线方法,也可以在下游应用程序中使用,比如文本/图像到3D生成。

2024-01-31 10:06:46 714 1

原创 一文速览自动驾驶行业近年来在端到端规划的研究进展

本文可以作为入门材料,供初学者追踪工业界和学术界最先进的自动驾驶端到端规划方法。

2024-01-30 11:51:39 641

原创 速度最快、地图占存最小的非结构化场景SLAM方法:SOS-SLAM

该框架非常适合多智能体场景,能够实现智能体之间的高效通信;且该框架能够在不同季节条件下的具有挑战性的非结构化环境中对齐帧,并且能够检测智能体自身的回环闭合。

2024-01-29 12:14:27 515

原创 4D高斯抛雪球模型问世:单视图视频也能快速生成动态3D对象

Efficient4D:一种新的4D图像生成框架,可以从单视图视频的简短视频中快速生成动态3D目标,且在保证高质量渲染的基础之上,将生成速度提升了10倍。

2024-01-26 10:42:43 660

原创 在各大机器人顶会顶刊发文的中国第一人

中国发第一篇机器人顶会的人都怎么样了?

2024-01-25 10:18:33 874

原创 “盲狗”具身定位:最新本体感知足式机器人里程计

此论文提出了一种四足机器狗的多节点IMU本体感知定位方法。在传统的单一体IMU与机器狗关节编码器的基础上,论文作者添加了足部多节点IMU辅助估计。论文使用了扩展卡尔曼滤波的信息融合方法进行状态估计。使用额外的足部多节点IMU,系统可以估计机器狗足部触地的多种模式以及打滑情况,而不需要足部的压力传感器。所提出的方法在硬件平台上进行了验证,表明了该方法相较于传统方法确实可以大幅降低定位漂移,所增加的计算量也十分有限。

2024-01-24 10:57:04 912

原创 ICLR2024:Adobe研究院开发出无扩散的生成式3D大模型

研究人员提出了一个大型重建模型(LRM),它可以在短短5秒内从单张输入图像中生成对应物体的三维模型。这项工作与以前许多在小规模数据集上训练的ShapeNet等方法相比,LRM采用了一种高度可扩展的基于具有5亿个可学习参数的transformer架构,直接从输入图像中推理NeRF三维表达。研究者在包含大约100万对象的大量多视图数据上以端到端方式训练模型,这种高容量模型和大规模训练数据的结合使得到的模型具有高度的可泛化性,并从各种数据测试输入中产生高质量的三维重建。

2024-01-23 10:30:45 833

原创 FB-BEV:从前后视图变化看BEV表示法

该模块使用反向投影,提炼前向投影中没有激活的空白3D网格,提高了大规模 BEV 特征表示的稳定性。

2024-01-22 11:59:50 914

原创 HDR-HexPlane:首个针对高动态场景的HDR-NERF框架

在新视图合成方面,HDR- HexPlane可以考虑过曝和欠曝的颜色区域,在动态HDR场景数据集上取得最先进的结果。

2024-01-19 17:27:46 836

原创 机器人跨越2D语义信息到3D几何信息的few-shot力作:F3RM

3RM提出可以利用强大的空间信息和先验的语义信息来实现对新物体的泛化,并最终用于机器人6-DOF的抓取放置。该方法使用从视觉语言模型CLIP提取出的特征,提供不同语义粒度级别的自然语言指导,实现对新对象的精细化识别抓取功能。

2024-01-18 14:55:26 1020

原创 NeRF-VO:实时稀疏视觉里程计与基于NeRF的稠密重建

本文提出了一种新型神经视觉里程计系统,结合了基于学习的稀疏视觉里程计、单目深度预测网络,进行基于神经辐射场优化,同时调整位姿和稠密地图。本系统展现优越的位姿估计精度,并提供高质量的稠密建图,同时保持较低的位姿跟踪延迟和 GPU 内存消耗。

2024-01-17 14:56:47 768

原创 仅用三张图片实现任意场景三维重建:ReconFusion

ReconFusion通过在三维重建过程中加入扩散模型作为先验来减少输入图片数量,利用少量视图信息即可完成高质量场景渲染与重建,为三维重建领域提供了新的研究方向。

2024-01-16 14:05:51 944 1

原创 SLAM中的二进制词袋生成过程和工作原理

长期视觉SLAM (Simultaneous Localization and Mapping)最重要的要求之一是鲁棒的位置识别。经过一段探索期后,当长时间未观测到的区域重新观测时,标准匹配算法失效。当它们被健壮地检测到时,回环检测提供正确的数据关联以获得一致的地图。用于环路检测的相同方法可用于机器人在轨迹丢失后的重新定位,例如由于突然运动,严重闭塞或运动模糊。包括从机器人在线收集的图像中建立一个数据库,以便在获取新图像时检索最相似的图像。如果它们足够相似,则检测到闭环。

2023-09-14 15:01:38 169

原创 基于传统的三维点云补全方法

然而,一个固有的问题是由于物体遮挡、镜面反射、物体自遮挡、视角变换和传感器分辨率的限制,传感器在真实场景下所获取的数据并不完整,阻碍了下游任务的研究进展。由于许多自然和人造物体表现出显著的对称性或包含重复的子结构,因此,最初的形状补全方法主要是利用物体或空间呈现的几何对称性,恢复缺失区域的重复结构。同时,在点云后续一系列的处理中,比如点云去噪、平滑、配准和融合等操作中,也会大大加剧点云的缺失,直接影响了点云重构、模型重建、局部空间信息提取和后续处理的质量。该方法可以考虑点云的全局特征,但计算复杂度较高。

2023-09-14 11:32:58 891 1

原创 算法岗求职,如何做出让人眼前一亮的简历?

使用清晰的字体和合适的字号,会使简历更易于阅读。最后再说一句,一份优秀的简历固然重要,但更重要的还是应聘者的自身实力,只有通过夯实理论基础,丰富实践经验,提升自身条件,你才能真正入企业招聘者的“法眼”。所以在编辑在简历内容的过程中,最重要的是展示真实的自己,在介绍自己专业素养的同时,也要注意将个人特点和个性融入其中,以使你能够在众多求职者中脱颖而出。图文并茂,很多人忽视了在简历中插入图片的重要性,合适的项目照片不但可以让简历排版更加美观,也可以直观地让企业了解你的项目内容,一下子吸引住HR的目光。

2023-06-02 18:50:05 580

一个半月吐血整理,各大厂500+求职者分享,1000+面试真题及经验收

真题题库、行业交流群已准备就绪! 大家三连后,评论区留言获取!

2022-09-16

俞刚-物体检测的过去、现在和未来.pdf

物体检测是计算机视觉的基础环节,对于很多计算机视觉任务的落地和研究都有非常重要的意义。本次分享主要从物体检测的问题切入,讨论物体检测的发展历程,从传统视觉年代,到深度学习时代的变革,到未来的发展趋势。也会分析工业界的落地发展历程,从传统时代的人脸检测到通用的物体检测。

2020-09-07

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除