自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(101)
  • 收藏
  • 关注

原创 [IDDPM] Improved Denoising Diffusion Probabilistic Models

对DDPM进行优化,重点优化log-likelihood2)减少采样步数,加速infer3)在high-diversity数据集,如imagenet上,获得了良好的结果。

2024-04-19 13:25:41 589

原创 [Classifier-Guided] Diffusion Models Beat GANs on Image Synthesis

针对diffusion models不如GAN的原因进行改进:1)充分探索网络结构2)在diversity和fidelity之间进行trade off。

2024-04-11 17:52:18 376

原创 [SDE] Score-Based Generative Modeling through Stochastic Differential Equations

扩散过程随时间进行(连续化)time-dependent神经网络估计score,用SDE求解反向生成过程。

2024-04-10 14:41:36 558

原创 [DDIM] Denoising Diffusion Implicit Models

DDPM生成图像需要模拟Markov链,因此要经过多轮推理(因为条件概率仅仅与系统的当前状态相关),且推理过程是sequentially而不是parallel的DDIM在不改变DDPM训练的基础上,减少了infer次数,在极大地增加了采样效率的同时,几乎不影响采样效果。

2024-04-08 18:43:15 239

原创 ubuntu 20.04安装一系列软件

【bug】

2023-12-20 16:16:27 1079

原创 生成扩散模型理论框架

即求解得分函数(Score function)。得分函数是数据的log密度的梯度(the gradient of the log-density with respect to the data vector),即。DDPM的一般化形式。DDIM的一般化形式。

2023-10-20 15:46:26 139

原创 常用数学定义

1、泰勒级数

2023-10-20 14:08:07 133

原创 [DDPM] Denoising Diffusion Probabilistic Models

直接看paper云里雾里,一些推荐的讲解: The Annotated Diffusion Model 生成扩散模型漫谈(一):DDPM = 拆楼 + 建楼 生成扩散模型漫谈(二):DDPM = 自回归式VAE 生成扩散模型漫谈(三):DDPM = 贝叶斯 + 去噪 已知确定的forward / diffusion过程:训练图像,逐步加噪声,最终得到高斯噪声图像 求解reverse过程:采样高斯噪声图像,逐步去噪,最终得到生

2023-07-25 21:16:56 291

原创 [StyleGAN] A Style-Based Generator Architecture for Generative Adversarial Networks

解耦出了生成网络中style的影响因素,并可以利用这一点实现不同生成图像的风格融合注意:该网络还是从噪声生成随机图像,只是可以把已经生成的随机图像的latent code相融合,得到介于两者之间的新类型图像;而不是根据手头的图像来实现风格融合。

2023-06-08 16:42:06 125

原创 [BigGAN] Large Scale GAN Training for High Fidelity Natural Image Synthesis

在大型数据集上训练class-conditional GAN,并探索相关的trick。

2023-06-06 20:52:23 622

原创 图像生成常用评估指标

Turkers were presented with a series of trials that pitted a “real” image against a “fake” image generated by our algorithm Train classifiers on real images. Score synthesized photos by the classification accuracy against the labels these photos wer

2023-05-27 18:44:37 264

原创 [CycleGAN] Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

以往的image-to-image translation需要有aligned image pairs。本文设计的方法可以用于unpaired(只提供image sets X和Y)风格转换。传统的GAN虽然也可以实现X -> Y的转换,但:1)无法保证生成的y和x是对应关系(same underlying scene)2)可能出现mode collapse。

2023-05-27 17:54:53 48

原创 [cGAN] Conditional Generative Adversarial Nets

unconditioned GAN生成的图像模式是不可控的。

2023-05-25 15:13:41 55

原创 [WGAN] Wasserstein GAN

文章用了大篇幅的理论证明了概率分布在EM distance下是收敛的,而在其他几个distance下是不收敛的。GAN的训练是delicate和unstable的。需要定义一个连续的距离。4)Earth-Mover(EM)距离 / Wasserstein-1。,来衡量模型distribution和真实distribution之间的差异。3)显著减少了模式坍塌现象。1)无须平衡D和G的训练。2)无须慎重设计网络结构。

2023-05-22 15:26:58 440

原创 [SRGAN] Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

过去的super-resolution (SR)算法通过最小化mean squared error (MSE)来进行优化,尽管可以提高peak signal-to-noise ratio (PSNR),但pixel-wise的图像监督无法捕捉到更精细的纹理细节。

2023-05-19 11:52:35 92

原创 [DCGAN] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

GAN的训练很不稳定,很容易得到毫无意义的结果。

2023-05-18 22:07:43 92

原创 一些python编程中常踩的坑

如果不想在改变sub_arr的时候,把arr也改了,那就记得加.copy()

2023-05-17 10:36:21 40

原创 [VAE] Auto-Encoding Variational Bayes

直接看paper看得云里雾里,一语道破天机(建议从30min左右开始看GAN到Diffusion的串讲)。VAE的核心思路就是下面:做生成,其实就是从随机向量(z)到目标图像(x)的过程,那么z就是先验,x就是后验。

2023-05-12 19:12:17 580

原创 机器学习基础

1、2、

2023-05-07 16:07:22 49

原创 DL面试常考问题

1、drop out相关

2022-12-05 11:45:07 304

原创 配准的一些基础知识总结

配准

2022-10-17 12:58:17 120

原创 DL中一些常用的计算公式

1、感受野计算公式2、

2022-09-26 16:32:32 379

原创 [Instance Normalization] The Missing Ingredient for Fast Stylization

instance normalization

2022-07-07 20:13:33 876

原创 Android开发入门

安卓app开发

2022-06-23 10:26:16 586

原创 [ConvLSTM] Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting阅读笔记

1、主要创新 相比于FC-LSTM,引入卷积层,1)可以充分利用空间关联,2)能够输出图像序列,3)减少参数冗余2、网络1)输入时空序列,特征数目=P,图像大小=MxN,即​​​​​​​​​​​​​​ 2)输出 3)网络设计 i: input ga...

2022-04-12 00:28:52 3015

原创 在本地打开远端服务器上Tensorboard

1、xshell查看->隧道窗格->转移规则,右键添加​​​​​​​​​​​​​​​​​​​​​​​​​​​​ 2、服务器端tensorboard --logdir xxx --port 60073、本地 浏览器打开​​​​​​​​​​​​​​http://localhost:6007...

2022-03-24 16:21:32 568

原创 pycharm连接服务器远程调试

pycharm必须下载专业版,教育版×,社区版×1、服务器需要跳板机登录有待尝试......2、服务器无须跳板机登录1、Tools->Deployment->Configuration,添加新的连接1)ssh configuration设置 认证方式可以选password;也可以配置ssh key,然后选择pair test connection测试是否能成功连接.........

2022-03-24 00:49:54 1532

原创 将本地ssh公钥加到服务器

服务器路径:~/.ssh/authorized_keys1、本地windows1)以管理员身份运行terminal2)ssh-keygen,在C:\Users\XXX\.ssh下生成id_rsa.pub(公钥)和id_rsa(私钥,不可外泄)2、本地linux ssh-keygen,在~/.ssh下生成相应内容...

2022-03-24 00:18:28 2116

原创 [pix2pixHD] High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs阅读笔记

blabla

2022-03-09 19:27:27 165

原创 [FUNIT] Few-Shot Unsupervised Image-to-Image Translation

1、目的无监督图像转换:source类 -> target类;其中target类的样本很少,只在test时用到;训练source类 -> 多个another类,其中another类的样本也较少;==> 通用的外观提取模型2、原理/基础1)人看到新物体(target class),可以基于以往的知识(trained model),脑补出新物体的不同姿势(generated picture)...

2022-03-07 17:24:17 416

原创 [GAN] Generative Adversarial Nets阅读笔记

1、目的通过对抗过程(G最大化D犯错的概率),模拟生成模型。理想情况下,存在最佳解:G可以还原训练数据的分布,D预测值始终为1/2。【通俗解释】G是假币制造团伙,D是公安机关;G的目标是使假币越来越逼真,D的目标是鉴别假币;通过双方势力的对抗学习,彼此最终都会得到提升。2、网络结构1)生成模型Ga)捕获数据分布 b)输入随机噪声,符合一...

2022-02-23 17:05:37 274

原创 [pix2pix]Image-to-Image Translation with Conditional Adversarial Networks阅读笔记

1、任务1) image-to-image translation2) common framework,适用于各种场景2、网络(image) conditional GANs (cGANs):image x + random noise vector z -> y 1) Generator...

2022-02-17 11:19:23 1605

原创 dicom2nifti配置

1、下载GDCMlinux系统安装gdcm的python库_工药叉的经文-CSDN博客_python 安装gdcm2、dicom2niftidicom2nifti — dicom2nifti documentation

2021-12-19 00:30:25 2604

原创 图像处理工具

1、nifti三视图查看软件https://www.nitrc.org/forum/forum.php?forum_id=8952DTI-TK Home Page

2021-12-15 19:47:26 2649

原创 常见图像模态介绍

1、CT

2021-12-15 16:27:09 747

原创 常见问题&解决方案

1、latex编辑工具 依次安装MiKTeX和textstudio; 安装texlive而不是MiKTeX的话可能会出现“Could not start Build and View:PdfLaTeX:pdflatex.exe -synctex=1 interaction=nonstopmode”这个问题

2021-11-10 13:55:41 795

原创 后端开发杂记

1、编译器的工作过程2、

2021-08-18 13:55:26 73

原创 医学图像数据格式

1、dicom 1)开篇 2)数据结构2、nifti3、raw+mhd

2021-08-02 18:35:12 203

原创 传统算法总结

1、分水岭 1)https://people.cmm.minesparis.psl.eu/users/beucher/wtshed.html 2)https://docs.opencv.org/master/d3/db4/tutorial_py_watershed.html

2021-07-23 18:34:39 177

原创 [ERFNet] Efficient Residual Factorized ConvNet for Real-time Semantic Segmentation

1、解决的问题 在IV(intelligent vehicles)实时任务中,有效的平衡计算资源和网路预测结果的准确性2、网络结构 1)卷积拆分 2)无skip connection 3)下采样:stride=2的conv3x3+max_pooling; 上采样:stride=2的deconv 4)用dilated conv增大感受野 5)drop...

2021-07-16 15:06:47 477 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除