自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

公众号『机器感知』

GitHub:https://github.com/jiauzhang

  • 博客(158)
  • 资源 (1)
  • 收藏
  • 关注

原创 GenVideo、SkelFormer、EfficientGS、HOLD、Motion Synthesis、Learn2Talk

本文首发于公众号:机器感知。

2024-04-22 18:36:10 975

原创 HQ-Edit、MaxFusion、Ctrl-Adapter、EdgeRelight360、Video2Game

本文首发于公众号:机器感知。

2024-04-22 18:33:41 734

原创 3D Dance、StyleBooth、AniClipart、6Img-to-3D、MeshLRM、​Lazy DiT

本文首发于公众号:机器感知。

2024-04-22 18:29:44 849

原创 LD-Pruner、EdgeFusion(On-Device T2I)、FreeDiff、TextCenGen、MemLLM

本文首发于公众号:机器感知。

2024-04-19 19:04:12 788

原创 TiNO-Edit、LongVQ、SLAIM、IntrinsicAnything、Factorized Diffusion

本文首发于公众号:机器感知。

2024-04-18 21:11:44 758

原创 Latent Guard、Tokenization in LLM、​3D Human Scan、FusionPortableV2

本文首发于公众号:机器感知。

2024-04-17 18:40:51 441

原创 Next-Scale Prediction、InstantStyle、Co-Speech Gesture Generation

本文首发于公众号:机器感知。

2024-04-17 18:35:48 862

原创 LoopAnimate、LLM-Seg、DreamScape、LoopGaussian、TransformerFAM

本文首发于公众号:机器感知。

2024-04-16 20:28:49 921

原创 CameraCtrl、EDTalk、Sketch3D、Diffusion^2、FashionEngine

本文首发于公众号:机器感知。

2024-04-15 19:26:55 980

原创 ​ControlNet++、Any2Point、ConsistencyDet、G-NeRF、GoMAvatar

本文首发于公众号:机器感知。

2024-04-15 19:23:59 945

原创 Style Transfer、Move Anything、InstantMesh、RealmDreamer、GoodDrag

本文首发于公众号:机器感知。

2024-04-11 18:31:35 991

原创 StoryImager、Face Morph、Hash3D、DreamView、Magic-Boost、SmartControl

本文首发于公众号:机器感知。

2024-04-10 18:50:07 909

原创 Stale Diffusion、Drag Your Noise、PhysReaction、CityGaussian

本文首发于公众号:机器感知。

2024-04-06 21:30:54 846

原创 PerOS、Motion Generation、Video Generation、SVGCraft、FlexiDreamer

本文首发于公众号:机器感知。

2024-04-02 23:18:26 843

原创 MambaMixer、NeSLAM、Talk3D、BundledSLAM、ShapeFusion

本文首发于公众号:机器感知。

2024-04-01 18:31:49 768

原创 HiRoPE、MoDiTalker、RecDiffusion、DreamSalon、InterDreamer、BAMM

本文首发于公众号:机器感知。

2024-03-29 18:10:58 979

原创 DiffStyler、Image Editing、Bidirectional Consistency Models

本文首发于公众号:机器感知。

2024-03-28 21:47:12 886

原创 DreamPolisher、InternLM2 、AniArtAvatar、PlainMamba、AniPortrait

本文首发于公众号:机器感知。

2024-03-27 22:05:23 674

原创 Gaussian Splatting、Talking Head、Portrait Animation、Video Editing

本文首发于公众号:机器感知。

2024-03-26 19:45:45 947

原创 WorldGPT、Pix2Pix-OnTheFly、StyleDyRF、ManiGaussian、Face SR

本文首发于公众号:机器感知。

2024-03-14 22:46:01 894

原创 Dataset Distillation、Motion Mamba、StyleGaussian、Block-wise LoRA

本文首发于公众号:机器感知。

2024-03-13 21:49:14 707

原创 VideoMamba、Video Reframing、DiffuMatting、VideoEdit、Style2Talker

本文首发于公众号:机器感知。

2024-03-12 23:38:59 673

原创 Image Editing、3D Textured Mesh、Image Composition、SplattingAvatar

本文首发于公众号:机器感知。

2024-03-11 23:49:31 956

原创 LLM量化、高保真图生视频、多模态肢体运动生成、高分辨率图像合成、低光图像/视频增强、相机相对姿态估计

本文首发于公众号:机器感知。

2024-03-06 19:04:22 874

原创 Softmax的硬件友好型替代品;1-bit量化感知训练;基于LLM的数据可视化;视觉概念驱动的图像生成

本文首发于公众号:机器感知。

2024-02-21 19:07:21 592

原创 扩散LLM上下文到128k;精细光照控制;人像视频风格迁移;生成任意尺寸和长宽比图像的ViT模型

本文首发于公众号:机器感知。

2024-02-20 20:56:41 650

原创 A Self-Cascade Diffusion Model;Interactive Image Colorization

本文首发于公众号:机器感知。

2024-02-19 23:22:26 988

原创 Efficient Tuning of T2I;Synthesis of Visual Arts;FP6-LLM

本文首发于公众号:机器感知。

2024-02-03 16:41:38 592

原创 用GPT-4训练微型机器人游泳;个性化图像生成;动态纹理迁移;光场合成

本文首发于公众号:机器感知。

2024-02-02 19:07:01 926

原创 任务导向的扩散模型压缩;万物皆可成像;根据舞蹈生成音乐;LLM长上下文对齐;LLM KV缓存量化;通过运动场辅助扩散模型图像编辑

本文首发于公众号:机器感知。

2024-02-01 19:15:07 730

原创 Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw

本文首发于公众号:机器感知。

2024-01-31 20:47:48 956

原创 多视角视频MAE;把任意人像插入到任意场景中;高分辨率可编辑视频卡通化;显示建模运动实现一致且可控的视频生成

本文首发于公众号:机器感知。

2024-01-30 18:58:04 873

原创 Virtual Assistant for Smartphone;Denoising Autoencoder;CrossMAE

本文首发于公众号:机器感知。

2024-01-29 20:44:55 538

原创 SpeechGPT-Gen;使用Agents编辑图像;多模态扩散模型图像生成

本文首发于公众号:机器感知。

2024-01-25 19:36:44 773

原创 使用强化学习提升扩散模型;轻量级LLM无损加速模块;使用RL动态调整Transformer每层参数量;Lumiere文本生成视频

本文首发于公众号:机器感知。

2024-01-24 18:51:37 815

原创 高分辨率图像合成;可控运动合成;虚拟试衣;在FPGA上高效运行二值Transformer

本文首发于公众号:机器感知。

2024-01-23 21:14:09 1119

原创 根据音乐合成舞蹈;提升预训练扩散模型分辨率;基于扩散模型的视频超分;LLM推理加速框架;3D控制运动人像合成

本文首发于公众号:机器感知。

2024-01-22 19:03:01 883

原创 可媲美Gen2的视频生成大一统模型;Vlogger根据用户描述生成分钟级视频;Vision Mamba提速2.8倍节省86.8%

本文首发于公众号:机器感知。

2024-01-20 09:55:14 779

原创 可定制多目标视频生成;LLM驱动的文生图;控制视频生成中运动目标轨迹;扩散模型做全景分割;实时多功能SAM;各种分割任务统一模型

本文首发于公众号:机器感知。

2024-01-19 19:35:34 927

原创 扩散模型参数量降低87%,且提升生成质量;通过蒸馏实现一步采样扩散模型;VideoCrafter2视频生成;深度感知图像合成

本文首发于公众号:机器感知。

2024-01-19 19:31:04 894

单片机交通灯课程设计

自动化类专业自控原理课程设计报告,资料,源代码,完横版

2016-07-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除