emergency_rose-CSDN博客

原创 [IDDPM] Improved Denoising Diffusion Probabilistic Models

对DDPM进行优化，重点优化log-likelihood2）减少采样步数，加速infer3）在high-diversity数据集，如imagenet上，获得了良好的结果。

2024-04-19 13:25:41 589

原创 [Classifier-Guided] Diffusion Models Beat GANs on Image Synthesis

针对diffusion models不如GAN的原因进行改进：1）充分探索网络结构2）在diversity和fidelity之间进行trade off。

2024-04-11 17:52:18 376

原创 [SDE] Score-Based Generative Modeling through Stochastic Differential Equations

扩散过程随时间进行（连续化）time-dependent神经网络估计score，用SDE求解反向生成过程。

2024-04-10 14:41:36 558

原创 [DDIM] Denoising Diffusion Implicit Models

DDPM生成图像需要模拟Markov链，因此要经过多轮推理（因为条件概率仅仅与系统的当前状态相关），且推理过程是sequentially而不是parallel的DDIM在不改变DDPM训练的基础上，减少了infer次数，在极大地增加了采样效率的同时，几乎不影响采样效果。

2024-04-08 18:43:15 239

原创生成扩散模型理论框架

即求解得分函数（Score function）。得分函数是数据的log密度的梯度（the gradient of the log-density with respect to the data vector），即。DDPM的一般化形式。DDIM的一般化形式。

2023-10-20 15:46:26 139

原创 [DDPM] Denoising Diffusion Probabilistic Models

直接看paper云里雾里，一些推荐的讲解： The Annotated Diffusion Model 生成扩散模型漫谈（一）：DDPM = 拆楼 + 建楼生成扩散模型漫谈（二）：DDPM = 自回归式VAE 生成扩散模型漫谈（三）：DDPM = 贝叶斯 + 去噪已知确定的forward / diffusion过程：训练图像，逐步加噪声，最终得到高斯噪声图像求解reverse过程：采样高斯噪声图像，逐步去噪，最终得到生

2023-07-25 21:16:56 291

原创 [StyleGAN] A Style-Based Generator Architecture for Generative Adversarial Networks

解耦出了生成网络中style的影响因素，并可以利用这一点实现不同生成图像的风格融合注意：该网络还是从噪声生成随机图像，只是可以把已经生成的随机图像的latent code相融合，得到介于两者之间的新类型图像；而不是根据手头的图像来实现风格融合。

2023-06-08 16:42:06 125

原创 [BigGAN] Large Scale GAN Training for High Fidelity Natural Image Synthesis

在大型数据集上训练class-conditional GAN，并探索相关的trick。

2023-06-06 20:52:23 622

原创图像生成常用评估指标

Turkers were presented with a series of trials that pitted a “real” image against a “fake” image generated by our algorithm Train classifiers on real images. Score synthesized photos by the classification accuracy against the labels these photos wer

2023-05-27 18:44:37 264

原创 [CycleGAN] Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

以往的image-to-image translation需要有aligned image pairs。本文设计的方法可以用于unpaired（只提供image sets X和Y）风格转换。传统的GAN虽然也可以实现X -> Y的转换，但：1）无法保证生成的y和x是对应关系（same underlying scene）2）可能出现mode collapse。

2023-05-27 17:54:53 48

原创 [cGAN] Conditional Generative Adversarial Nets

unconditioned GAN生成的图像模式是不可控的。

2023-05-25 15:13:41 55

原创 [WGAN] Wasserstein GAN

文章用了大篇幅的理论证明了概率分布在EM distance下是收敛的，而在其他几个distance下是不收敛的。GAN的训练是delicate和unstable的。需要定义一个连续的距离。4）Earth-Mover（EM）距离 / Wasserstein-1。，来衡量模型distribution和真实distribution之间的差异。3）显著减少了模式坍塌现象。1）无须平衡D和G的训练。2）无须慎重设计网络结构。

2023-05-22 15:26:58 440

原创 [SRGAN] Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

过去的super-resolution (SR)算法通过最小化mean squared error (MSE)来进行优化，尽管可以提高peak signal-to-noise ratio (PSNR)，但pixel-wise的图像监督无法捕捉到更精细的纹理细节。

2023-05-19 11:52:35 92

原创 [DCGAN] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

GAN的训练很不稳定，很容易得到毫无意义的结果。

2023-05-18 22:07:43 92

原创一些python编程中常踩的坑

如果不想在改变sub_arr的时候，把arr也改了，那就记得加.copy()

2023-05-17 10:36:21 40

原创 [VAE] Auto-Encoding Variational Bayes

直接看paper看得云里雾里，一语道破天机（建议从30min左右开始看GAN到Diffusion的串讲）。VAE的核心思路就是下面：做生成，其实就是从随机向量（z）到目标图像（x）的过程，那么z就是先验，x就是后验。

2023-05-12 19:12:17 580

原创机器学习基础

1、2、

2023-05-07 16:07:22 49

原创 DL面试常考问题

1、drop out相关

2022-12-05 11:45:07 304

原创配准的一些基础知识总结

配准

2022-10-17 12:58:17 120

原创 DL中一些常用的计算公式

1、感受野计算公式2、

2022-09-26 16:32:32 379

原创 [Instance Normalization] The Missing Ingredient for Fast Stylization

instance normalization

2022-07-07 20:13:33 876

原创 Android开发入门

安卓app开发

2022-06-23 10:26:16 586

原创 [ConvLSTM] Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting阅读笔记

1、主要创新相比于FC-LSTM，引入卷积层，1）可以充分利用空间关联，2）能够输出图像序列，3）减少参数冗余2、网络1）输入时空序列，特征数目=P，图像大小=MxN，即 2）输出 3）网络设计 i: input ga...

2022-04-12 00:28:52 3015

原创在本地打开远端服务器上Tensorboard

1、xshell查看->隧道窗格->转移规则，右键添加 2、服务器端tensorboard --logdir xxx --port 60073、本地浏览器打开http://localhost:6007...

2022-03-24 16:21:32 568

原创 pycharm连接服务器远程调试

pycharm必须下载专业版，教育版×，社区版×1、服务器需要跳板机登录有待尝试......2、服务器无须跳板机登录1、Tools->Deployment->Configuration，添加新的连接1）ssh configuration设置认证方式可以选password；也可以配置ssh key，然后选择pair test connection测试是否能成功连接.........

2022-03-24 00:49:54 1532

原创将本地ssh公钥加到服务器

服务器路径：~/.ssh/authorized_keys1、本地windows1）以管理员身份运行terminal2）ssh-keygen，在C:\Users\XXX\.ssh下生成id_rsa.pub（公钥）和id_rsa（私钥，不可外泄）2、本地linux ssh-keygen，在~/.ssh下生成相应内容...

2022-03-24 00:18:28 2116

原创 [pix2pixHD] High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs阅读笔记

blabla

2022-03-09 19:27:27 165

原创 [FUNIT] Few-Shot Unsupervised Image-to-Image Translation

1、目的无监督图像转换：source类 -> target类；其中target类的样本很少，只在test时用到；训练source类 -> 多个another类，其中another类的样本也较少；==> 通用的外观提取模型2、原理/基础1）人看到新物体（target class），可以基于以往的知识（trained model），脑补出新物体的不同姿势（generated picture）...

2022-03-07 17:24:17 416

原创 [GAN] Generative Adversarial Nets阅读笔记

1、目的通过对抗过程（G最大化D犯错的概率），模拟生成模型。理想情况下，存在最佳解：G可以还原训练数据的分布，D预测值始终为1/2。【通俗解释】G是假币制造团伙，D是公安机关；G的目标是使假币越来越逼真，D的目标是鉴别假币；通过双方势力的对抗学习，彼此最终都会得到提升。2、网络结构1）生成模型Ga）捕获数据分布 b）输入随机噪声，符合一...

2022-02-23 17:05:37 274

原创 [pix2pix]Image-to-Image Translation with Conditional Adversarial Networks阅读笔记

1、任务1) image-to-image translation2) common framework，适用于各种场景2、网络(image) conditional GANs (cGANs)：image x + random noise vector z -> y 1) Generator...

2022-02-17 11:19:23 1605

原创 dicom2nifti配置

1、下载GDCMlinux系统安装gdcm的python库_工药叉的经文-CSDN博客_python 安装gdcm2、dicom2niftidicom2nifti — dicom2nifti documentation

2021-12-19 00:30:25 2604

原创图像处理工具

1、nifti三视图查看软件https://www.nitrc.org/forum/forum.php?forum_id=8952DTI-TK Home Page

2021-12-15 19:47:26 2649

原创常见图像模态介绍

1、CT

2021-12-15 16:27:09 747

原创常见问题&解决方案

1、latex编辑工具依次安装MiKTeX和textstudio；安装texlive而不是MiKTeX的话可能会出现“Could not start Build and View:PdfLaTeX:pdflatex.exe -synctex=1 interaction=nonstopmode”这个问题

2021-11-10 13:55:41 795

原创后端开发杂记

1、编译器的工作过程2、

2021-08-18 13:55:26 73

原创医学图像数据格式

1、dicom 1）开篇 2）数据结构2、nifti3、raw+mhd

2021-08-02 18:35:12 203

原创传统算法总结

1、分水岭 1）https://people.cmm.minesparis.psl.eu/users/beucher/wtshed.html 2）https://docs.opencv.org/master/d3/db4/tutorial_py_watershed.html

2021-07-23 18:34:39 177

原创 [ERFNet] Efficient Residual Factorized ConvNet for Real-time Semantic Segmentation

1、解决的问题在IV（intelligent vehicles）实时任务中，有效的平衡计算资源和网路预测结果的准确性2、网络结构 1）卷积拆分 2）无skip connection 3）下采样：stride=2的conv3x3+max_pooling；上采样：stride=2的deconv 4）用dilated conv增大感受野 5）drop...

2021-07-16 15:06:47 477 1

空空如也

空空如也