自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(133)
  • 资源 (8)
  • 收藏
  • 关注

原创 基于Pycharm运行李沐老师的深度学习课程代码

最近在b站看李沐老师的深度学习课程,受益颇多。不过觉得光看视频实在是不过瘾,最好还是能实际的玩起来。鉴于我还是习惯使用pycharm,且不需要过多的中间过程展示,所以代码的编写基本都是在pycharm进行。由于李沐老师的代码主要是在Jupyter运行的,在pycharm上使用会略有差异。本篇博客以求解线性优化问题代码为例,来谈一谈在pycharm运行相关代码的一些注意事项。

2022-08-23 17:00:08 5556 6

原创 Nvidia最新三维重建技术Instant-ngp初探

最近逛技术论坛,发现一个牛到了不得的英伟达项目,刚刚发布,其全称为:Instant Neural Graphics Primitives,项目链接为:https://github.com/NVlabs/instant-ngp该项目提出一个称为Multiresolution Hash Encoding的技术,能够大大提升NeRF网络的训练速度,使之可以从几分钟缩短到几秒钟(非常惭愧的是,NeRF这个被广泛接受的三维重建技术我也是第一次听说)。其演示结果好的让人震惊。...

2022-04-22 20:44:15 23529 6

原创 Win10快速部署基于Pytorch(GPU)的深度学习环境

目前,接受度最高的深度学习框架恐怕就是Pytorch了。相对来说,Pytorch部署比较简单,版本之间的兼容程度明显好于Tensorflow。使用一些预先定义好的框架实现深度学习功能还是很方便的。这篇博客基于我对Pytorch代码部署的一些经验,提炼出一些部署该平台的注意事项,希望能够帮助那些对于该平台没有任何知识背景的同学,尽快上手。1. 基于Anaconda虚拟环境的Python环境首先我们需要安装Pycharm与Anaconda。Pycharm:下载 PyCharm:JetBrains 为

2022-04-05 14:29:22 2008 3

原创 C++各种数据类型(char*, string, int, double等)的相互转换

岁数大了,脑子就记不住东西了。每次写程序,到了数据转换这里,都要现查网上的代码。为了节省时间,我就在这篇博客里列出一些经常用到的类型转换代码,方便查找并使用,也希望能够帮助有需要的同学。1. String转换string转char*和char[]string _3D_object_path="Hello!";char * p = new char[strlen(_3D_object_path.c_str()) + 1];strcpy(p, _3D_object_path.c_str());

2022-01-28 16:10:35 2441

原创 3D高斯溅射:面向三维场景的实时渲染技术

高斯溅射技术一经推出,立刻引起学术界和工业界的广泛关注。相比传统的隐式神经散射场渲染技术,高斯溅射依托椭球空间,显性地表示多目图像的三维空间关系,其计算效率和综合性能均有较大的提升,且更容易理解。可以预见,未来2年针对高斯溅射的应用研究将会迎来爆炸式发展。通过本篇博文,我和大家来一起了解高斯溅射技术,希望对有需要的同学提供一点帮助。

2024-02-11 22:14:10 3966

原创 Point-BERT:一种基于Transformer架构的点云深度网络

引入基于掩码预测的BERT架构[3],实现对点云弱监督条件下的特征训练,是解决上述问题的一个重要的思路。Point-BERT将点云的局部邻域视为一个点云词汇,对应一个Token。尤其在OpenAI的GPT模型获得了突破性成果后,一系列的点云深度学习研究开始向相同的技术方向靠拢,即基于Transformer架构的深度网络模型。早期利用Transformer架构的点云深度网络[2],虽然采用了注意力机制来设计实现,但是受限于三维数据的标定,并未发挥出其在语言和视觉领域的性能。

2023-12-24 15:00:46 1952

原创 Multidimensional Scaling(MDS多维缩放)算法及其应用

在这篇博客中,我将与大家分享在流形分析领域的一个非常重要的方法,即多维缩放MDS。整体来说,该方法提供了一种将内蕴距离映射到显性欧氏空间的计算,为非刚性形状分析提供了一种解决方案。当初就是因为读了Bronstein的相关工作[1],才下定决心在人脸数据分析中使用内蕴度量来建立特征分析方法,可以说MDS对我的学术之路起到了很大的影响作用。

2023-12-06 18:01:49 376

原创 Geodesic in Heat: 一种测地线计算方法

在之前的博客中,我已经介绍过了使用Fast Marching算法计算测地线。Fast Marching的好处是实现简单,方便扩展在点云上。但是缺点是精度不够,求解不平滑。早在2013年,Crane et al. [1]就已经提出利用热流来估算测地距离。我很早就知道这个解决方案,大概是利用了拉普拉斯余切权重来实现一个二阶偏微分计算,以获得更精确的结果。这次恰好要做点云上的测地线计算,就把原文下载下来好好的学习一下。

2023-12-05 18:44:00 461

原创 Linux(ubuntu)系统更新后不能进入图形界面

最近需要跑一个深度学习的程序,把许久没用的ubuntu系统调了出来,手欠的我更新了一下系统,结果再启动,系统就只停留在光标闪动那里,不能看到图形界面了。网上查了一下,说是因为更新后,显卡驱动没有编译,使得重新进入系统后,显卡驱动出现问题。折腾了一轮,总算是把这个坑爹的问题解决了,重新安装了Nvidia显卡驱动。我在这个博客做一下记录,以做备忘。

2023-09-23 21:59:43 2584 1

原创 点云深度学习系列博客(七): 针对点云的数据增强技术

点云数据本身的数据规模存在极大的限制,目前主流的ModelNet40也就40个类别,就算组合了shapeNet,其数据量远远不能覆盖实际的样本空间,使得模型的泛化性收到了极大的限制。另外,由于点云属于三维数据,其表示形式自然要比文本和图像复杂,受到坐标系的限制会更大,对于姿态,尺度等更加敏感。这使得对于点云建立特征学习模型变得尤其困难。因此,面向点云的数据增强研究被提出。

2023-06-19 19:29:12 2635

原创 GAN网络系列博客(三):不受坐标限制的GAN(StyleGAN3)

关于StyleGAN3,其贡献已经在题目中说的非常清楚了,不受坐标限制(Alias-Free)。在没有认真看正文文字内容的前提下,仅通过上面的图片,我对StyleGAN3实现的猜测是,首先找到对应的语义区域,之后建立非刚性的对应关系,在此基础上指导生成模型,并控制生成对象不超过语义限定区域,使得整个变换过程类似于非刚性形变过程。带着这样一种猜测,我们来看一下StyleGAN3的具体实现。

2023-04-17 19:26:38 1114 1

原创 KSS-ICP: 基于形状分析技术的点云配准方法

三维点云配准是三维视觉领域一个经典问题,涉及三维重建,定位,SLAM等具体应用问题。最近,南洋理工大学的研究人员提出一种新的点云配准方法KSS-ICP,结合了形状分析与传统ICP算法,有效的改善了配准算法的性能。今天,我在这篇博客里就来介绍一下这篇论文。

2023-03-27 17:09:20 1974 1

原创 火遍全球的ChatGPT技术简介与主干网络代码

如果说当下最火的AI技术和话题是什么,恐怕很难绕开ChatGPT。各大厂商都在表示未来要跟进ChatGPT技术,开发在自然语言处理智能系统,可见其影响力。本篇博客追个热度,来简单的介绍下ChatGPT到底是一项什么技术,究竟如何完成复杂的语言处理任务的。

2023-02-12 14:55:14 8386

原创 点云深度学习系列博客(六): Point Transformer方法概述

基于注意力机制的深度学习模型在起初设计时,针对的是NLP问题。包括词元分析,翻译等语言处理任务,注意力机制能够训练超大规模数据,并建立学习模型,获得显著的性能提升。鉴于注意力机制在NLP任务中的空前成功,视觉领域也尝试引入注意力机制,著名工作包括VIT [1] 和Swin Transformer [2]。对于点云数据处理,一些基于Transformer模型 [3][4] 的工作也被提出。本文以文献 [3] 为基础,概述在点云数据处理任务中引入Point Transformer的具体思路。

2023-02-10 23:13:49 4615

原创 点云深度学习系列博客(五): 注意力机制原理概述

随着Transformer模型在NLP,CV甚至CG领域的流行,注意力机制(Attention Mechanism)被越来越多的学者所注意,将其引入各种深度学习任务中,以提升性能。清华大学胡世民教授团队近期发表在CVM上的Attention综述 [1],详细介绍了该领域相关研究的进展。对于点云应用,引入注意力机制,设计新的深度学习模型,自然是一个研究热点。本文以注意力机制为对象,概述其发展脉络,以及在点云应用领域的成功应用,为期望在该研究方向有所突破的同学,提供一点参考。

2023-02-10 16:52:56 4041

原创 我的2022年

昨天迎来了庄里的第一场雪,街道上银装素裹,为小年增添了不少冬日特有的气氛。在街上散步,回想着2022这一年我的科研工作,有值得骄傲的成果,也有些许遗憾。今天看到CSDN举办的年度征稿活动,勾起了我写一篇年终总结的想法。我决定用一篇博客来总结我在2022年科研工作的所思所感,同时记录下我对未来计划的展望,作为对自己,对长期关注本博客的朋友们一次朴素的分享,并送上对新年美好的祝愿。

2023-01-15 17:16:48 281

原创 Neural-Pull曲面重建程序配置

前几天一篇曲面重建文章的审稿意见回来了,要求加近三年对比方法。在github上搜了一些项目,大部分的环境都很难配置成功。最后找了一个ICML2021年的点云重建项目作为实验对比。

2023-01-07 21:58:36 677

原创 VS2022点云库PCL1.12配置过程中遇到的一些奇葩问题

最近处于换工作的间歇期,原来配置的电脑交公了,各种程序数据都做了搬家。对这些程序重新配置,可以说是一地鸡毛。系统对不上,各个开源库版本一团乱麻,尤其是配置PCL库的时候,遇到了各种奇奇怪怪的问题,包括boost编译,标识符识别错误等等,简直让人无语。在本文中,我把遇到的一些奇葩问题做一个总结,以作备忘。

2023-01-06 18:56:44 1254 5

原创 基于颜色直方图优化的图像增强方法

最近改图像颜色迁移的论文,审稿人要求补充基于直方图优化的方法细节。趁此机会,我重新下载了相关文献,决定重新学习下该类方法,并把一些细节记录在本篇博客中,供交流学习。

2022-12-29 14:24:21 1422 3

原创 GAN网络系列博客(二):改善StyleGAN的图像质量

在上一篇博客中,我们已经介绍了StyleGAN的基本实现。其主要通过间接隐空间映射,消除了对初始输入分布的硬性约束,能够比较灵活的迁移不同的风格到生成器的各层中。但是,该项工作生成的人脸图像,仍然存在一些不稳定的情况,其图像质量以及语义结构不能被保证。为了解决该问题,StyleGAN2被提出。

2022-11-10 19:24:57 1217

原创 GAN网络系列博客(一):用于人脸生成的StyleGAN结构

在未来的一段时间,我会开一个小专题,来介绍下GAN网络的一些经典论文。希望对那些想要入坑的同学提供一点点帮助。考虑到StyleGAN系列论文在相关领域的影响力,我们首先来介绍下StyleGAN的开山之作:A Style-Based Generator Architecture。

2022-10-21 00:11:59 1434 1

原创 CUDA程序调试的一些经验

最近在做一个点云配准的项目,重新把之前就开始玩的CUDA重新拾起来。本来想着稍微改改代码就能够愉快的跑起来,结果改Bug改的我相当上头。结合我之前的帖子和我最近的一些调试经验,总结一个调CUDA程序的一个博客,以方便以后再次遇到类似项目的时候,能够有个参考。简单来说,整个调试可以按照四个步骤来进行,包括存储分配检查,变量名检查,核函数输出检查以及核函数局部存储空间回收。

2022-10-11 18:44:52 1536

原创 点云深度学习系列博客(四): PointNet代码精讲

最近开始上手点云深度学习项目,相比之前纸上谈兵的阶段,此时我将把更多的精力放在代码学习和复现上。在新的学习阶段,就不能是看看论文,蜻蜓点水的配下别人的代码这么简单了。我将逐句分析代码功能,结合实际应用,来深入理解点云深度学习的项目该如何落地。作为点云深度学习的代表作,PointNet的经典程度不言而喻。我们就以PointNet的模板,来展开相关代码的实现,并完全复现PointNet的基本功能。对于那些零基础,计划入坑点云深度学习的同学,不妨看看。

2022-09-14 09:11:58 3683 8

原创 我复现的第一个神经网络: LeNet

学习深度学习已经有小一年的时间,看了很多视频和书本内容,学习了很多代码,可始终感觉认知不够扎实。结合李沐老师的视频课程,我决定在本博客中介绍下复现LeNet的过程。代码基于Pycharm2021平台,选用python3.8版本+Pytorch1.12.1+cu116。基本上把各个包的版本都刷到最新版本,以方便后续的网络升级和向后兼容。

2022-09-07 18:36:22 1811 3

原创 基于Eigen求解线性方程组Ax=b的性能分析

​在上一篇博客中,我们介绍了三维人脸参数化方法。在该算法中,涉及到求解线性方程AX=b的问题。这里的A为针对网格的拉普拉斯权重矩阵,规模是比较大的,尺度为N*N,N为网格点数。对于人脸数据,动则10000以上的点数,为线性方程求解带来挑战。Eigen提供了一系列的求解线性方程的解法,本博客就基于人脸参数化方法,对比下这些解法的性能特点,以帮助需要深入了解求解大规模线性方程的同学,选择合适的计算工具。

2022-09-05 13:54:58 1270

原创 基于测地距离场的三维人脸参数化方法

三维人脸数据的识别与处理,一直是视觉与图形学领域的热点问题。相对于人脸图像来说,三维人脸数据拥有完整的几何信息,能够支持更加精确的人脸数据分析算法。在进行相关的计算之前,我们希望三维人脸能够有一个统一的表示形式,以准确的界定人脸的区域以及对应的位置,尽可能的消除姿态以及尺度不一致带来的影响。基于该目的,人脸参数化方法被提出。

2022-09-02 16:23:44 1401

原创 基于C++的Latex表格代码自动生成

相信做科研的同学一定经常接触到Latex。Latex做为脚本控制的自动排版系统,其生成的文本整洁,清楚,对于图表的自动布局,能够有效的安排页面空间,使用户的文本可以直接获得印刷出版物级别的质量。但是Latex有一个非常蛋疼的地方,就是表格。Latex表格是通过格式化的表示形式实现其排版的,其过程繁琐,容易出错。每次想到要将一个大的表格排到Latex里,就头疼。鉴于表格生成的复杂性,一些表格代码自动生成工具应运而生。......

2022-08-18 16:23:07 1255

原创 浅谈计算机领域顶会与顶刊的那些事

最近在网上闲逛,发现很多做CS的学生都在问发顶刊还是顶会这样的问题,相关的回答可谓千差万别,真是公说公有理,婆说婆有理。我觉得有些信息值得讨论,但是有些信息明显是谬误。鉴于这些谬误会对CS专业背景的研究生产生误导,我决定在这篇博客中谈一谈CS期刊和会议的一些相关话题,以帮助那些CS背景的研究生和青年学者,找到最适合的科研成果发表途径。............

2022-08-18 12:26:53 6359 3

原创 点云深度学习系列博客(三): 多尺度特征分析

最近做深度学习研究,发现在视觉任务中,使用多尺度特征建立对图像的特征描述,大概率能够得到好的结果。自然地,如果能把多尺度特征推广到点云分析的任务中,直观感觉应该也能够获得性能提升。正好最近researchgate推给我一篇论文[1],就是基于该想法提出了一个网络实现。今天就来跟大家一起学习下这篇文章,看一看如何利用多尺度特征提升点云分析任务的性能。...

2022-08-15 17:51:36 4074 7

原创 CVPR2022Oral专题系列(三):图像增强主干网络MAXIM

随着Transformer和多层感知机技术的普及,一些过去难以解决的计算机视觉问题,能够被处理,并在实际的应用中加以使用。但是,这里仍然存在一些挑战,包括:对高分辨率图像的兼容性较差;对局部注意力缺乏有效的处理方法。今天,我们来介绍一篇CVPR2022Oral论文,即多轴MLP结构MAXIM,以解决上述问题。...

2022-08-05 18:24:51 3125 3

原创 CVPR2022Oral专题系列(二):多帧图像合成与增强

在本系列的上一篇博客中,我们已经介绍了一种低光图像的处理方法。对于一般性的手持拍照设备,受限于抖动以及对象运动的影响,使得单帧图片会产生模糊。为了完成对类似图像的质量增强,Burst Image Restoration被提出。其原理为通过设备所获取的一个图像序列,通过对帧间相关信息的分析,以实现对模糊的处理,进而增强图像质量。本博客今天介绍一种方法,Burst Image Restoration and Enhancement [1],以完成该目标。......

2022-08-02 19:08:47 4711 7

原创 CVPR2022Oral专题系列(一):低光增强

这周立了Flag,一定要出一篇关于CVPR2022Oral论文解度博客。刚刚完成一个期刊的大修,马上就打开CSDN,就敲起键盘来。可见做什么事儿,都得有一口气顶住,才能不拖沓。闲话少叙,今天我们介绍的文章是大连理工大学的研究者所提出的一项关于低光增强的工作。...

2022-07-24 20:33:46 3908 3

原创 Eigen矩阵运算库快速上手

做科研类项目,尤其是与线性优化,主成分分析有关的项目,势必需要用到矩阵计算及相关的优化工具。很多同学会利用matlab完成项目需求,这当然是一个不错的选择。但是,对于平台有一定要求的项目,尤其是那些基于C++开发的工程项目,使用matlab就会带来一些不便。我们希望有方便的矩阵开源工具,可以集成在项目中,以简化程序部署与使用的难度。这里就不得不提到大名鼎鼎的矩阵开源库,Eigen。今天这篇博客,就来跟大家介绍下Eigen部署与使用的基本知识,方便新手朋友能够快速掌握基于Eigenv实现的矩阵计算与优化功能。

2022-06-30 17:34:51 4605

原创 浅谈CVPR2022的几个研究热点

CVPR2022刚刚结束,作为影响力最广的视觉盛会,今年又有一批优秀的工作被展示出来。相信关注视觉最新研究进展的各位小伙伴,已经磨拳擦掌,准备向CVPR2023投稿了。基于今年的工作,到底哪些领域是CVPR关注的热点?哪些领域的工作,接受度更高,oral的比例更大呢?基于CVPR官方最新的统计信息,我将跟大家聊聊CVPR的一些研究热点,希望对那些计划投下一轮CVPR的同学提供一点参考信息。............

2022-06-25 15:06:43 12791 2

原创 浅谈调和形状上下文特征HSC对3DSC的改进

在上一篇博客中(浅谈三维形状上下文特征3DSC理论及应用),我们已经介绍了3DSC的设计原理以及实现细节,以及该特征在一定程度上受限于法线估计的缺陷。事实上,在文献[1]中,作者在提出3DSC的同时,也给出了对应的解决方案,以缓解3DSC的内在缺陷,即调和形状上下文特征HSC。今天我们将具体学习一下HSC的原理以及实现。.........

2022-06-10 13:59:44 550 1

原创 浅谈三维形状上下文特征3DSC理论及应用

​在之前的博客中,我们已经介绍过了使用FPFH在点云上建立局部形状描述,实现对点云局部隐曲面几何特征的高效表达(浅谈FPFH算法实现原理及其在点云配准中的应用)。今天,我们将介绍另外一种局部形状描述子: 3DShapeContext (3DSC)。最近上课需要准备这部分内容,本打算找一个现成的博客学习一下了事的。但是看了几个博客,感觉还是差点意思,于是我下载了原始论文,从头读了一遍,将一些原理与实现细节在这篇博客做个展开,希望能够帮助到有需要的同学。...

2022-06-09 19:02:37 2057 3

原创 VS2019+Libtorch实现基于C++的图像语义分割

​基于深度学习框架的图像语义分割算法在近年成为主流研究方向,包括像DeepLab系列,U-Net等,在ImageNet,Cityscapes,PASCAL VOC 2012等库上,都获得了不错的性能。在之前的博客中,我们已经介绍了DeepLabV3+。我在最近的研究中,希望可以直接在C++上部署类似的图像语义分割程序,并在VS平台集成的项目中使用其强大的图像语义分析功能。

2022-06-02 18:13:15 2268 4

原创 基于Pytorch实现的图像分割算法: DeepLabV3+

图像分割可以算是图像处理领域最重要的几个问题之一了。随着自动驾驶,广告推荐,手机照片处理,知识图谱等智能应用的快速普及,基于语义分析的图像分割、理解与识别变得越来越重要。近年来比较热的视觉领域工作,很大比重是围绕如何使用大规模数据,结合结构优良的深度网络模型,实现图像分割计算。今天,我们就来学习一项该领域的著名工作(DeepLabV3+)。

2022-05-31 14:17:52 18944 18

原创 点云深度学习系列博客(二): 点云配准网络PCRNet

凡是对点云相关应用有些了解的同学,相信都接触过点云配准。配准相关的经典算法,包括ICP,NDT,FPFH,已被广泛应用于工业设计,定位,SLAM,自动驾驶等领域。尤其在SLAM和自动驾驶领域,随着家庭清扫机器人和电动汽车的普及,基于激光扫描技术的点云配准技术越发重要。可见点云配准及其相关研究的重要性。今天的点云深度学习系列博客为大家介绍一个用于点云配准深度网络:PCRNet [1]。

2022-05-20 18:36:41 4824 4

原创 点云深度学习系列博客(一): 点云特征学习网络PCPNet

最近开始研究点云分析的相关项目,经过文献调研我发现,近几年比较热的方法,基本都是基于深度学习框架设计的。正好我计划在2022年切入点云深度学习这个研究方向,于是我决定创建一个博客专题,翻译和编辑一批具有代表性意义的点云深度学习研究报告,即方便为我自己的研究计划提供素材,又希望能够帮助到有需要的小伙伴参考与学习。如果你对这个专题感兴趣,希望能够关注我的博客,那将是对我创作的最大支持。

2022-04-30 13:08:50 4420 1

基于有道智云的英文词汇分析程序.rar

基于有道智云的英文词汇分析程序,实现对词汇文件的翻译,并输出词汇的原型形式。

2019-09-11

基于Face++SDK的人脸特征点定位项目(VS2017)

基于Face++的SDK,实现的人脸特征点定位工具。重写了源文件中的一些json解析代码和命令请求代码。可以实现83点与106点探测的切换。返回数据存储在一个vector中,使用opencv显示程序就可以看到。使用前需要在Face++官网上注册账户并配置应用,将相应的APPID和密码写到main函数里的对应位置就可以。

2018-12-04

百度自然语言处理项目(VS2017)

基于VS2017,利用百度自然语言处理项目接口以及提供的代码,实现对语句的分词以及词性分析。在使用项目之前,需要在百度注册应用,并复制app_id;api_key;secret_key ;到自己的项目中。

2018-12-04

CURL&JSON;&OPENSSL;

网上一些AI项目所需要的附加依赖库(curl, json和openssl),在VS平台下编译以方便使用。

2018-12-04

语义理解项目( VS2017+灵云NLU语义理解项目)

资源是基于灵云的SDK和demo资源配好的一个项目。修正了项目连接错误的问题。需要注意的是,在灵云的能力部署时,应该把所有的领域都勾选上。

2018-11-17

人脸识别视频定位

使用harr分类器做的一个人脸视频定位,默认寻找视频中最大的人脸,采用了ROI来提速

2015-07-28

车牌信息提取(OpenCV)

基于一个已经完成的车牌信息提取程序,能够做到对车牌位置的提取,角度校正,为之后的识别做好基础。

2015-05-14

光线追踪源程序

一个光线追踪的源程序,有助于了解相关的渲染技术

2013-04-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除