自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 onnx-trt 问题汇总

记录trt 和squeeze 所有的bug问题

2024-03-05 11:55:15 356

原创 HumanAI

关于人体的一些技术分享,包含不限于人体检测(body detection)、人脸检测、人手检测、人体关键点2d、3d检测、手部关键点2d、3d检测、人脸2d、3d关键点检测、眼动追踪、人脸三维重建(model based)、数字人驱动(UE或者其他的场景里面的数字人);相机标定、双目相机;可以在AR、VR,辅助驾驶,交互,游戏等领域进行使用。

2024-02-27 14:42:52 410 2

原创 足球分析代码框架,单视图2d和多视角3d的可以进行结合

【代码】足球分析代码框架,单视图2d和多视角3d的可以进行结合。

2024-01-20 11:35:30 346 1

原创 足球赛事分析

通过对足球运动员以及足球的检测,并进行跟踪。可以绘制足球、运动员的运动轨迹。一直找不到固定机位的视频,所以足球的跟踪那里有些小问题。

2024-01-19 17:21:14 375

原创 VideoRetaling细读

上图是添加表情后的效果,更加合理自然拆分为三个时序任务,具体做法后面介绍。

2024-01-01 12:31:51 347

原创 wave2lip 细读

现在的项目都是对一张图片或者一个固定用户的视频进行训练。存在的问题是:对随机的用户、不受限制的说话视频效果比较差。我们的做法:一个强大的判别器, 提出了一个新的评估指标,有demo且开源。

2023-12-30 20:17:17 468

原创 LipGAN 细读

近年机器翻译效果突飞猛进,数字场景交流需求的增加,所以在音频翻译的基础上做了face翻译。face 翻译就是从一个语言到另一个语言的唇形同步。speech-to-speech 翻译系统LipGAN实现 Face-to-Face 翻译我们的成果LRW 测试 遥遥领先有现实项目落地代码、模型开源。

2023-12-30 12:56:10 783

原创 pytorch train和eval 效果不同的原因

pytorch

2023-02-03 15:11:38 482

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除