- 博客(226)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 2023最新SLAM面试题汇总(持续更新中)
目前机器人SLAM问题是一个非常值得研究的方向,在未知环境中,首先要通过SLAM技术获得环境的地图,然后才能进行导航。这个方向是近几年比较新的研究方向,相关的机器人公司以及研究机器人的大厂也很需要SLAM方向的人才。...
2022-07-20 19:12:20 4803 4
原创 FSGS:少视图输入的实时3D-GS新方法
FSGS只需3张输入图像就可以生成逼真的新视角图像,并以超过200帧/秒的速度执行推理过程,为实时渲染等任务提供了更加节省成本与快速的方法。
2024-03-22 11:21:59 617
原创 MIT提出最新时空语义SLAM框架:Khronos
MIT团队提出一个解决语义度量化的同时定位与建图问题的系统框架Khronos,可以解释长期短期的动态变化,并且能够实时构建密集的时空地图。真实环境会经历短期和长期的变化,而当前的研究都没有对这两种变化进行推理的统一方法。
2024-03-19 15:51:10 641
原创 入选CVPR2024:SNI-SLAM,融合外观、几何和语义的神经隐式SLAM
本文是发布在CVPR 2024的论文,提出了SNI-SLAM:一个利用神经隐式表示的语义SLAM系统,它能够同时执行准确的语义建图、高质量的表面重建和稳健的相机跟踪。
2024-03-15 11:17:13 986
原创 LOGICHOI:融合神经计算与符号推理,革新人-物交互检测
相较于传统的视觉感知任务,如object或单个action的识别,HOI检测更注重实体推理,因此在图像合成、视觉问题解答和标题生成等场景理解任务中具有广泛应用。
2024-03-12 12:13:13 868
原创 VOOM:面向目标的SLAM方法再升级?
本文提出了一种新的视觉目标里程计和建图框架VOOM,以由粗到精的方式将高级目标和低级特征点作为分层路标,并且验证了相比于面向目标的SLAM和特征点SLAM系统的定位性能。
2024-03-11 16:05:33 906
原创 通用操作接口UMI:如何快速简单地给机器人提供更多学习数据?
斯坦福团队提出通用操纵接口(UMI)通用框架,可以直接从人类演示中学习有能力且可泛化的操纵策略。该项工作解决了机器人训练中“先有鸡还是先有蛋”的难题。。
2024-03-04 12:01:07 826
原创 掌握线性状态空间:从零构建一个Mamba神经网络架构
Mamba 是一个线性时间序列建模框架,旨在提高序列建模的效率和有效性。本文将深入探讨使用 PyTorch 实现 Mamba 的过程,讨论这一创新方法背后的技术问题和代码。
2024-03-01 18:26:52 1216 1
原创 首个基于地面纹理的单目SLAM,复杂光照环境中也能精准定位
本文介绍了一种无需事先构建地图即可实时在线SLAM的解决方案。通过使用朝下的单目相机捕获地面纹理图像,即使在环境特征稀疏或光照条件复杂的情况下也能提供可靠的定位信息。
2024-02-29 14:32:40 580
原创 最新类脑模型M-Detector:首个登上Nature的动态点云流检测架构
本文提出了一种类脑模型M-Detector,用于点级别的动态环境检测。M-Detector基于遮挡原理,模仿视觉巨细胞的工作机理,实现了高性能且低开销的点级别动态点云流检测,可应用于高动态避障以及高精建图等各种任务。
2024-02-28 11:02:15 802
原创 MARC:一种安全又高效的时空联合规划的方法
本文提出的MARC算法,结合了多策略的场景树和风险感知的Contingency Planning的优点, 考虑了风险等级的容忍度和不确定性来生成安全且互动性的驾驶行为。它的主要特点是场景和规划都是基于树结构,并且能够充分利用到多策略和多模式信息,使得获得的最优策略是针对所有场景的最优结果。
2024-02-27 11:09:59 1237
原创 不需要COLMAP的3DGS投影?
CF-3DGS是一个端到端的框架,可以从图像序列中联合估计相机姿态和新视角合成。借助高斯投影的优势,该方法可实现快速训练和推理。
2024-02-26 18:44:05 705
原创 最新研究iTransformer: Transformer不适合多变量时序预测?
iTransformer是2024年时间序列预测领域的最新研究成果,目前在标准时间序列预测数据集上展现出SOTA。
2024-02-23 11:25:19 1242
原创 VirtualPainting:新一代多传感器融合方案,大幅提升3D目标检测性能
本文提出了一种新颖的方法,它利用图像生成LiDAR虚拟点,通过基于图像的分割网络提供的语义标签来增强这些虚拟点,从而克服点云的稀疏性问题,提高了对稀疏分布对象的检测能力,有效解决了自动驾驶领域的一大痛点。
2024-02-22 12:03:40 980
原创 SA-GS:在3D高斯抛雪球中实现SAM任意物体分割
大量的分割实验表明,SA-GS可以有效地在三维高斯中获得高质量的物体分割结果,从而可以轻松地应用于场景编辑和碰撞检测任务。
2024-02-07 10:37:46 715
原创 最新模型VMamba:颠覆视觉Transformer,下一代主流Backbone?
卷积神经网络(CNN)与视觉Transformer(ViT)是目前最流行的两种视觉表征基础模型。CNN在线性复杂度下,具有惊人的可扩展性。ViTs在性能方面超过了CNN,但是其具有平方复杂度。经深入分析,ViT具有更加强大性能的原因在于:它利用了全局的感受野和动态的权重分配方法。因此,一种既具有ViT全局感知优势,又具有高计算效率的框架需要被提出。受到状态空间模型启发,我们提出了视觉状态空间模型(VMamba),这个模型能够在不破坏全局感受野的前提下,达到线性的计算复杂度。
2024-02-06 10:07:21 2294
原创 InverseMatrixVT3D:简单高效实现三维占用预测模型!
本方法不需要基于Transformer的查询或深度估计,这使得3D体积生成过程简单又高效。
2024-02-04 10:33:38 871
原创 Adobe又一力作:无位姿稀疏视图即可重建3D大模型?
目前该模型在姿态预测精度和重建质量方面大大优于基线方法,也可以在下游应用程序中使用,比如文本/图像到3D生成。
2024-01-31 10:06:46 714 1
原创 速度最快、地图占存最小的非结构化场景SLAM方法:SOS-SLAM
该框架非常适合多智能体场景,能够实现智能体之间的高效通信;且该框架能够在不同季节条件下的具有挑战性的非结构化环境中对齐帧,并且能够检测智能体自身的回环闭合。
2024-01-29 12:14:27 515
原创 4D高斯抛雪球模型问世:单视图视频也能快速生成动态3D对象
Efficient4D:一种新的4D图像生成框架,可以从单视图视频的简短视频中快速生成动态3D目标,且在保证高质量渲染的基础之上,将生成速度提升了10倍。
2024-01-26 10:42:43 660
原创 “盲狗”具身定位:最新本体感知足式机器人里程计
此论文提出了一种四足机器狗的多节点IMU本体感知定位方法。在传统的单一体IMU与机器狗关节编码器的基础上,论文作者添加了足部多节点IMU辅助估计。论文使用了扩展卡尔曼滤波的信息融合方法进行状态估计。使用额外的足部多节点IMU,系统可以估计机器狗足部触地的多种模式以及打滑情况,而不需要足部的压力传感器。所提出的方法在硬件平台上进行了验证,表明了该方法相较于传统方法确实可以大幅降低定位漂移,所增加的计算量也十分有限。
2024-01-24 10:57:04 912
原创 ICLR2024:Adobe研究院开发出无扩散的生成式3D大模型
研究人员提出了一个大型重建模型(LRM),它可以在短短5秒内从单张输入图像中生成对应物体的三维模型。这项工作与以前许多在小规模数据集上训练的ShapeNet等方法相比,LRM采用了一种高度可扩展的基于具有5亿个可学习参数的transformer架构,直接从输入图像中推理NeRF三维表达。研究者在包含大约100万对象的大量多视图数据上以端到端方式训练模型,这种高容量模型和大规模训练数据的结合使得到的模型具有高度的可泛化性,并从各种数据测试输入中产生高质量的三维重建。
2024-01-23 10:30:45 833
原创 HDR-HexPlane:首个针对高动态场景的HDR-NERF框架
在新视图合成方面,HDR- HexPlane可以考虑过曝和欠曝的颜色区域,在动态HDR场景数据集上取得最先进的结果。
2024-01-19 17:27:46 836
原创 机器人跨越2D语义信息到3D几何信息的few-shot力作:F3RM
3RM提出可以利用强大的空间信息和先验的语义信息来实现对新物体的泛化,并最终用于机器人6-DOF的抓取放置。该方法使用从视觉语言模型CLIP提取出的特征,提供不同语义粒度级别的自然语言指导,实现对新对象的精细化识别抓取功能。
2024-01-18 14:55:26 1020
原创 NeRF-VO:实时稀疏视觉里程计与基于NeRF的稠密重建
本文提出了一种新型神经视觉里程计系统,结合了基于学习的稀疏视觉里程计、单目深度预测网络,进行基于神经辐射场优化,同时调整位姿和稠密地图。本系统展现优越的位姿估计精度,并提供高质量的稠密建图,同时保持较低的位姿跟踪延迟和 GPU 内存消耗。
2024-01-17 14:56:47 768
原创 仅用三张图片实现任意场景三维重建:ReconFusion
ReconFusion通过在三维重建过程中加入扩散模型作为先验来减少输入图片数量,利用少量视图信息即可完成高质量场景渲染与重建,为三维重建领域提供了新的研究方向。
2024-01-16 14:05:51 944 1
原创 SLAM中的二进制词袋生成过程和工作原理
长期视觉SLAM (Simultaneous Localization and Mapping)最重要的要求之一是鲁棒的位置识别。经过一段探索期后,当长时间未观测到的区域重新观测时,标准匹配算法失效。当它们被健壮地检测到时,回环检测提供正确的数据关联以获得一致的地图。用于环路检测的相同方法可用于机器人在轨迹丢失后的重新定位,例如由于突然运动,严重闭塞或运动模糊。包括从机器人在线收集的图像中建立一个数据库,以便在获取新图像时检索最相似的图像。如果它们足够相似,则检测到闭环。
2023-09-14 15:01:38 169
原创 基于传统的三维点云补全方法
然而,一个固有的问题是由于物体遮挡、镜面反射、物体自遮挡、视角变换和传感器分辨率的限制,传感器在真实场景下所获取的数据并不完整,阻碍了下游任务的研究进展。由于许多自然和人造物体表现出显著的对称性或包含重复的子结构,因此,最初的形状补全方法主要是利用物体或空间呈现的几何对称性,恢复缺失区域的重复结构。同时,在点云后续一系列的处理中,比如点云去噪、平滑、配准和融合等操作中,也会大大加剧点云的缺失,直接影响了点云重构、模型重建、局部空间信息提取和后续处理的质量。该方法可以考虑点云的全局特征,但计算复杂度较高。
2023-09-14 11:32:58 891 1
原创 算法岗求职,如何做出让人眼前一亮的简历?
使用清晰的字体和合适的字号,会使简历更易于阅读。最后再说一句,一份优秀的简历固然重要,但更重要的还是应聘者的自身实力,只有通过夯实理论基础,丰富实践经验,提升自身条件,你才能真正入企业招聘者的“法眼”。所以在编辑在简历内容的过程中,最重要的是展示真实的自己,在介绍自己专业素养的同时,也要注意将个人特点和个性融入其中,以使你能够在众多求职者中脱颖而出。图文并茂,很多人忽视了在简历中插入图片的重要性,合适的项目照片不但可以让简历排版更加美观,也可以直观地让企业了解你的项目内容,一下子吸引住HR的目光。
2023-06-02 18:50:05 580
俞刚-物体检测的过去、现在和未来.pdf
2020-09-07
矩阵指数与对数运算的实现
2014-10-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人