JiauZhang-CSDN博客

原创 GenVideo、SkelFormer、EfficientGS、HOLD、Motion Synthesis、Learn2Talk

本文首发于公众号：机器感知。

2024-04-22 18:36:10 975

原创 HQ-Edit、MaxFusion、Ctrl-Adapter、EdgeRelight360、Video2Game

本文首发于公众号：机器感知。

2024-04-22 18:33:41 734

原创 3D Dance、StyleBooth、AniClipart、6Img-to-3D、MeshLRM、Lazy DiT

本文首发于公众号：机器感知。

2024-04-22 18:29:44 849

原创 LD-Pruner、EdgeFusion(On-Device T2I)、FreeDiff、TextCenGen、MemLLM

本文首发于公众号：机器感知。

2024-04-19 19:04:12 788

原创 TiNO-Edit、LongVQ、SLAIM、IntrinsicAnything、Factorized Diffusion

本文首发于公众号：机器感知。

2024-04-18 21:11:44 758

原创 Latent Guard、Tokenization in LLM、3D Human Scan、FusionPortableV2

本文首发于公众号：机器感知。

2024-04-17 18:40:51 441

原创 Next-Scale Prediction、InstantStyle、Co-Speech Gesture Generation

本文首发于公众号：机器感知。

2024-04-17 18:35:48 862

原创 LoopAnimate、LLM-Seg、DreamScape、LoopGaussian、TransformerFAM

本文首发于公众号：机器感知。

2024-04-16 20:28:49 921

原创 CameraCtrl、EDTalk、Sketch3D、Diffusion^2、FashionEngine

本文首发于公众号：机器感知。

2024-04-15 19:26:55 980

原创 ControlNet++、Any2Point、ConsistencyDet、G-NeRF、GoMAvatar

本文首发于公众号：机器感知。

2024-04-15 19:23:59 945

原创 Style Transfer、Move Anything、InstantMesh、RealmDreamer、GoodDrag

本文首发于公众号：机器感知。

2024-04-11 18:31:35 991

原创 StoryImager、Face Morph、Hash3D、DreamView、Magic-Boost、SmartControl

本文首发于公众号：机器感知。

2024-04-10 18:50:07 909

原创 Stale Diffusion、Drag Your Noise、PhysReaction、CityGaussian

本文首发于公众号：机器感知。

2024-04-06 21:30:54 846

原创 PerOS、Motion Generation、Video Generation、SVGCraft、FlexiDreamer

本文首发于公众号：机器感知。

2024-04-02 23:18:26 843

原创 MambaMixer、NeSLAM、Talk3D、BundledSLAM、ShapeFusion

本文首发于公众号：机器感知。

2024-04-01 18:31:49 768

原创 HiRoPE、MoDiTalker、RecDiffusion、DreamSalon、InterDreamer、BAMM

本文首发于公众号：机器感知。

2024-03-29 18:10:58 979

原创 DiffStyler、Image Editing、Bidirectional Consistency Models

本文首发于公众号：机器感知。

2024-03-28 21:47:12 886

原创 DreamPolisher、InternLM2 、AniArtAvatar、PlainMamba、AniPortrait

本文首发于公众号：机器感知。

2024-03-27 22:05:23 674

原创 Gaussian Splatting、Talking Head、Portrait Animation、Video Editing

本文首发于公众号：机器感知。

2024-03-26 19:45:45 947

原创 WorldGPT、Pix2Pix-OnTheFly、StyleDyRF、ManiGaussian、Face SR

本文首发于公众号：机器感知。

2024-03-14 22:46:01 894

原创 Dataset Distillation、Motion Mamba、StyleGaussian、Block-wise LoRA

本文首发于公众号：机器感知。

2024-03-13 21:49:14 707

原创 VideoMamba、Video Reframing、DiffuMatting、VideoEdit、Style2Talker

本文首发于公众号：机器感知。

2024-03-12 23:38:59 673

原创 Image Editing、3D Textured Mesh、Image Composition、SplattingAvatar

本文首发于公众号：机器感知。

2024-03-11 23:49:31 956

原创 LLM量化、高保真图生视频、多模态肢体运动生成、高分辨率图像合成、低光图像/视频增强、相机相对姿态估计

本文首发于公众号：机器感知。

2024-03-06 19:04:22 874

原创 Softmax的硬件友好型替代品；1-bit量化感知训练；基于LLM的数据可视化；视觉概念驱动的图像生成

本文首发于公众号：机器感知。

2024-02-21 19:07:21 592

原创扩散LLM上下文到128k；精细光照控制；人像视频风格迁移；生成任意尺寸和长宽比图像的ViT模型

本文首发于公众号：机器感知。

2024-02-20 20:56:41 650

原创 A Self-Cascade Diffusion Model；Interactive Image Colorization

本文首发于公众号：机器感知。

2024-02-19 23:22:26 988

原创 Efficient Tuning of T2I；Synthesis of Visual Arts；FP6-LLM

本文首发于公众号：机器感知。

2024-02-03 16:41:38 592

原创用GPT-4训练微型机器人游泳；个性化图像生成；动态纹理迁移；光场合成

本文首发于公众号：机器感知。

2024-02-02 19:07:01 926

原创任务导向的扩散模型压缩；万物皆可成像；根据舞蹈生成音乐；LLM长上下文对齐；LLM KV缓存量化；通过运动场辅助扩散模型图像编辑

本文首发于公众号：机器感知。

2024-02-01 19:15:07 730

原创 Single-Head ViT；Faster Whisper；Transformer KF；Pick-and-Draw

本文首发于公众号：机器感知。

2024-01-31 20:47:48 956

原创多视角视频MAE；把任意人像插入到任意场景中；高分辨率可编辑视频卡通化；显示建模运动实现一致且可控的视频生成

本文首发于公众号：机器感知。

2024-01-30 18:58:04 873

原创 Virtual Assistant for Smartphone；Denoising Autoencoder；CrossMAE

本文首发于公众号：机器感知。

2024-01-29 20:44:55 538

原创 SpeechGPT-Gen；使用Agents编辑图像；多模态扩散模型图像生成

本文首发于公众号：机器感知。

2024-01-25 19:36:44 773

原创使用强化学习提升扩散模型；轻量级LLM无损加速模块；使用RL动态调整Transformer每层参数量；Lumiere文本生成视频

本文首发于公众号：机器感知。

2024-01-24 18:51:37 815

原创高分辨率图像合成；可控运动合成；虚拟试衣；在FPGA上高效运行二值Transformer

本文首发于公众号：机器感知。

2024-01-23 21:14:09 1119

原创根据音乐合成舞蹈；提升预训练扩散模型分辨率；基于扩散模型的视频超分；LLM推理加速框架；3D控制运动人像合成

本文首发于公众号：机器感知。

2024-01-22 19:03:01 883

原创可媲美Gen2的视频生成大一统模型；Vlogger根据用户描述生成分钟级视频；Vision Mamba提速2.8倍节省86.8%

本文首发于公众号：机器感知。

2024-01-20 09:55:14 779

原创可定制多目标视频生成；LLM驱动的文生图；控制视频生成中运动目标轨迹；扩散模型做全景分割；实时多功能SAM；各种分割任务统一模型

本文首发于公众号：机器感知。

2024-01-19 19:35:34 927

原创扩散模型参数量降低87%，且提升生成质量；通过蒸馏实现一步采样扩散模型；VideoCrafter2视频生成；深度感知图像合成

本文首发于公众号：机器感知。

2024-01-19 19:31:04 894

单片机交通灯课程设计

空空如也