- 博客(101)
- 收藏
- 关注
原创 [IDDPM] Improved Denoising Diffusion Probabilistic Models
对DDPM进行优化,重点优化log-likelihood2)减少采样步数,加速infer3)在high-diversity数据集,如imagenet上,获得了良好的结果。
2024-04-19 13:25:41 589
原创 [Classifier-Guided] Diffusion Models Beat GANs on Image Synthesis
针对diffusion models不如GAN的原因进行改进:1)充分探索网络结构2)在diversity和fidelity之间进行trade off。
2024-04-11 17:52:18 376
原创 [SDE] Score-Based Generative Modeling through Stochastic Differential Equations
扩散过程随时间进行(连续化)time-dependent神经网络估计score,用SDE求解反向生成过程。
2024-04-10 14:41:36 558
原创 [DDIM] Denoising Diffusion Implicit Models
DDPM生成图像需要模拟Markov链,因此要经过多轮推理(因为条件概率仅仅与系统的当前状态相关),且推理过程是sequentially而不是parallel的DDIM在不改变DDPM训练的基础上,减少了infer次数,在极大地增加了采样效率的同时,几乎不影响采样效果。
2024-04-08 18:43:15 239
原创 生成扩散模型理论框架
即求解得分函数(Score function)。得分函数是数据的log密度的梯度(the gradient of the log-density with respect to the data vector),即。DDPM的一般化形式。DDIM的一般化形式。
2023-10-20 15:46:26 139
原创 [DDPM] Denoising Diffusion Probabilistic Models
直接看paper云里雾里,一些推荐的讲解: The Annotated Diffusion Model 生成扩散模型漫谈(一):DDPM = 拆楼 + 建楼 生成扩散模型漫谈(二):DDPM = 自回归式VAE 生成扩散模型漫谈(三):DDPM = 贝叶斯 + 去噪 已知确定的forward / diffusion过程:训练图像,逐步加噪声,最终得到高斯噪声图像 求解reverse过程:采样高斯噪声图像,逐步去噪,最终得到生
2023-07-25 21:16:56 291
原创 [StyleGAN] A Style-Based Generator Architecture for Generative Adversarial Networks
解耦出了生成网络中style的影响因素,并可以利用这一点实现不同生成图像的风格融合注意:该网络还是从噪声生成随机图像,只是可以把已经生成的随机图像的latent code相融合,得到介于两者之间的新类型图像;而不是根据手头的图像来实现风格融合。
2023-06-08 16:42:06 125
原创 [BigGAN] Large Scale GAN Training for High Fidelity Natural Image Synthesis
在大型数据集上训练class-conditional GAN,并探索相关的trick。
2023-06-06 20:52:23 622
原创 图像生成常用评估指标
Turkers were presented with a series of trials that pitted a “real” image against a “fake” image generated by our algorithm Train classifiers on real images. Score synthesized photos by the classification accuracy against the labels these photos wer
2023-05-27 18:44:37 264
原创 [CycleGAN] Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
以往的image-to-image translation需要有aligned image pairs。本文设计的方法可以用于unpaired(只提供image sets X和Y)风格转换。传统的GAN虽然也可以实现X -> Y的转换,但:1)无法保证生成的y和x是对应关系(same underlying scene)2)可能出现mode collapse。
2023-05-27 17:54:53 48
原创 [cGAN] Conditional Generative Adversarial Nets
unconditioned GAN生成的图像模式是不可控的。
2023-05-25 15:13:41 55
原创 [WGAN] Wasserstein GAN
文章用了大篇幅的理论证明了概率分布在EM distance下是收敛的,而在其他几个distance下是不收敛的。GAN的训练是delicate和unstable的。需要定义一个连续的距离。4)Earth-Mover(EM)距离 / Wasserstein-1。,来衡量模型distribution和真实distribution之间的差异。3)显著减少了模式坍塌现象。1)无须平衡D和G的训练。2)无须慎重设计网络结构。
2023-05-22 15:26:58 440
原创 [SRGAN] Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
过去的super-resolution (SR)算法通过最小化mean squared error (MSE)来进行优化,尽管可以提高peak signal-to-noise ratio (PSNR),但pixel-wise的图像监督无法捕捉到更精细的纹理细节。
2023-05-19 11:52:35 92
原创 [DCGAN] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks
GAN的训练很不稳定,很容易得到毫无意义的结果。
2023-05-18 22:07:43 92
原创 [VAE] Auto-Encoding Variational Bayes
直接看paper看得云里雾里,一语道破天机(建议从30min左右开始看GAN到Diffusion的串讲)。VAE的核心思路就是下面:做生成,其实就是从随机向量(z)到目标图像(x)的过程,那么z就是先验,x就是后验。
2023-05-12 19:12:17 580
原创 [Instance Normalization] The Missing Ingredient for Fast Stylization
instance normalization
2022-07-07 20:13:33 876
原创 [ConvLSTM] Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting阅读笔记
1、主要创新 相比于FC-LSTM,引入卷积层,1)可以充分利用空间关联,2)能够输出图像序列,3)减少参数冗余2、网络1)输入时空序列,特征数目=P,图像大小=MxN,即 2)输出 3)网络设计 i: input ga...
2022-04-12 00:28:52 3015
原创 在本地打开远端服务器上Tensorboard
1、xshell查看->隧道窗格->转移规则,右键添加 2、服务器端tensorboard --logdir xxx --port 60073、本地 浏览器打开http://localhost:6007...
2022-03-24 16:21:32 568
原创 pycharm连接服务器远程调试
pycharm必须下载专业版,教育版×,社区版×1、服务器需要跳板机登录有待尝试......2、服务器无须跳板机登录1、Tools->Deployment->Configuration,添加新的连接1)ssh configuration设置 认证方式可以选password;也可以配置ssh key,然后选择pair test connection测试是否能成功连接.........
2022-03-24 00:49:54 1532
原创 将本地ssh公钥加到服务器
服务器路径:~/.ssh/authorized_keys1、本地windows1)以管理员身份运行terminal2)ssh-keygen,在C:\Users\XXX\.ssh下生成id_rsa.pub(公钥)和id_rsa(私钥,不可外泄)2、本地linux ssh-keygen,在~/.ssh下生成相应内容...
2022-03-24 00:18:28 2116
原创 [pix2pixHD] High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs阅读笔记
blabla
2022-03-09 19:27:27 165
原创 [FUNIT] Few-Shot Unsupervised Image-to-Image Translation
1、目的无监督图像转换:source类 -> target类;其中target类的样本很少,只在test时用到;训练source类 -> 多个another类,其中another类的样本也较少;==> 通用的外观提取模型2、原理/基础1)人看到新物体(target class),可以基于以往的知识(trained model),脑补出新物体的不同姿势(generated picture)...
2022-03-07 17:24:17 416
原创 [GAN] Generative Adversarial Nets阅读笔记
1、目的通过对抗过程(G最大化D犯错的概率),模拟生成模型。理想情况下,存在最佳解:G可以还原训练数据的分布,D预测值始终为1/2。【通俗解释】G是假币制造团伙,D是公安机关;G的目标是使假币越来越逼真,D的目标是鉴别假币;通过双方势力的对抗学习,彼此最终都会得到提升。2、网络结构1)生成模型Ga)捕获数据分布 b)输入随机噪声,符合一...
2022-02-23 17:05:37 274
原创 [pix2pix]Image-to-Image Translation with Conditional Adversarial Networks阅读笔记
1、任务1) image-to-image translation2) common framework,适用于各种场景2、网络(image) conditional GANs (cGANs):image x + random noise vector z -> y 1) Generator...
2022-02-17 11:19:23 1605
原创 dicom2nifti配置
1、下载GDCMlinux系统安装gdcm的python库_工药叉的经文-CSDN博客_python 安装gdcm2、dicom2niftidicom2nifti — dicom2nifti documentation
2021-12-19 00:30:25 2604
原创 图像处理工具
1、nifti三视图查看软件https://www.nitrc.org/forum/forum.php?forum_id=8952DTI-TK Home Page
2021-12-15 19:47:26 2649
原创 常见问题&解决方案
1、latex编辑工具 依次安装MiKTeX和textstudio; 安装texlive而不是MiKTeX的话可能会出现“Could not start Build and View:PdfLaTeX:pdflatex.exe -synctex=1 interaction=nonstopmode”这个问题
2021-11-10 13:55:41 795
原创 传统算法总结
1、分水岭 1)https://people.cmm.minesparis.psl.eu/users/beucher/wtshed.html 2)https://docs.opencv.org/master/d3/db4/tutorial_py_watershed.html
2021-07-23 18:34:39 177
原创 [ERFNet] Efficient Residual Factorized ConvNet for Real-time Semantic Segmentation
1、解决的问题 在IV(intelligent vehicles)实时任务中,有效的平衡计算资源和网路预测结果的准确性2、网络结构 1)卷积拆分 2)无skip connection 3)下采样:stride=2的conv3x3+max_pooling; 上采样:stride=2的deconv 4)用dilated conv增大感受野 5)drop...
2021-07-16 15:06:47 477 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人