萧班-CSDN博客

原创 Win10 笔记本本地摄像头提供 Rtsp 视频流服务

在win10上用RTSP实现摄像头捕捉视频的实时传输。

2022-11-27 15:09:38 2550 1

原创 Delaunay Image Triangulation

DT 算法实现图像三角风格化。

2022-06-01 14:36:36 412 1

原创想在 Ubuntu 上放飞梦想的小黑菜（2）

1. Jupyter Notebook 远程连接先说一些 P 话：通常情况下，我们需要通过 windows 笔记本（mac 笔记本大佬请不屑路过）连接远程服务器调试实验。Notebook 是 debug 和 demo 的最好工具之一，特别是在可视化的时候。使用 ssh 连接的服务器，当系统是无界面版本时，就服务法使用 firefox 了，因此，远程连接 notebook 总会显得令人愉悦。网上有不少教程，但是都说得不够清楚，故作此文。1.1 远程服务器（ubuntu）上的准备进入工作的 pytho

2021-12-04 19:24:26 1065

原创图卷积的一些应用实例（1）

图卷积在 CV 的全局推理中的应用（Global Reasoning）1. Graph-Based Global Reasoning Networks. (CVPR 2019)基本思想主要技术创新 GloRe1️⃣ 仅依靠卷积的感受野有限，要么堆叠卷积层；2️⃣ 图卷积天然考虑全图节点之间的关系，具有全局感受野；3️⃣ 因此对中间层特征通过 GloRe 模块作全局交互来实现类似特征增强的目的；4️⃣ 具体地，将特征从坐标空间投影到交互空间，图卷积增强后，再逆投影回坐标空间，继

2021-11-03 14:11:27 1030

原创 Image Shape Manipulation from a Single Augmented Training Sample

Profile\mathbf{Profile}Profile直接上图好吧，????，本文要实现的任务：1️⃣ 只使用一组图像对 (a),(b)(a), (b)(a),(b) 作为训练数据，其中称 (a)(a)(a) 为元素图像（Primitive Image\mathbf {Primitive~Image}Primitive Image），称 (b)(b)(b) 为目标图像（Target Image\mathbf{Target~Image}Target Image）

2021-09-22 20:28:43 554

原创 Globally Optimal Toon Tracking

最近看了师公的一篇文章，果然偶尔看看传统算法的文章，才能对问题的本质有深刻的理解，特此记录，敬畏前人。该任务的可视化例子如下：????原项目地址1. Optical Flow 不能用于赛璐璐（cel）动画的原因1️⃣ 不能保证动画的内容（运动）是物理上正确的；2️⃣ 对象运动更剧烈（Choppy & Vigorous）；3️⃣ 动画对象缺乏充足的纹理。2. 任务难点1️⃣ 存在多个外形（Appearance）相似的区域（Region）；2️⃣ 某个 Region

2021-09-16 20:28:16 208

原创 User-Guided Line Art Flat Filling with Split Filling Mechanism

Profile这篇文章想要解决的问题是纯线稿图画的“平涂（Flat Filling）”的问题；就像《神秘花园》一样，又不限于花花草草与几何图形，可以是任意的形象。与一般的自然图像着色和动漫线稿上色不同，前者（如 LOHOGAN）有丰富的亮度提供纹理支持，后者（如 StylePaints-v2）需要考虑渐变与亮/暗面；平涂就是线稿包围的一个区域仅填充一种颜色。鉴于文章的图过于模糊（应该是 ppt 保留为图片贴上去的），视觉效果请见原文：User-Guided Line Art Flat Filling

2021-08-04 11:14:26 748

原创 Anycost GANs for Interactive Image Synthesis and Editing

Profile\rm ProfileProfile平日里我们使用 Pr\rm PrPr、Ae\rm AeAe 做视频的时候，预览模式可以选择分辨率 {full,1/2,1/4,etc.}\rm \{full, 1/2, 1/4, etc.\}{full,1/2,1/4,etc.}，便于适应不同的边缘设备、模型复杂度下的实时预览和流畅的人机交互操作。这篇文章首次将 Preview\rm PreviewPreview 应用到了基于 GAN\rm GANGAN 的图像编辑任务中——大规模的生成网络如 Sty.

2021-03-25 14:57:47 1006 5

原创 GoodCodes: FFHQ/CelebA数据与处理——人脸图像对齐

这是一段 StyleGAN(v2) 使用的人脸图像对齐代码，也可用于其他任务和其他人脸数据集的对齐。import numpy as np from PIL import Image from tqdm import tqdmimport osimport jsonimport matplotlib.pyplot as plt import scipy import scipy.ndimage## 全局变量output_size = 256transform_size = 256.

2021-02-21 17:42:03 2062 3

原创 StyleGAN-v2 ADA 的 pytorch 代码分析与实际使用

Resources\rm ResourcesResources ???? Paper\rm PaperPaper >> Training Generative Adversarial Networks with Limited Data\rm Training~Generative~Adversarial~Networks~with~Limited~DataTraining Generative Adv

2021-02-14 15:13:20 4113 5

原创 Training Generative Adversarial Networks with Limited Data

Profile四大生成模型之一的 GAN 由一对生成器 G 和鉴别器 D 构成。以图像生成为 ????，GAN 的训练有两个特点：☝ 在缺乏其他限制下，生成的图像的分布严格近似于 D 看到的真实图像分布；✌ 对于生成模型，过拟合（over fitting 只能复现训练时见过的样本）优于欠拟合（under fitting，训练炸了，无法生成自然的图像）。G 过拟合的发生比较少；G 欠拟合是更常见的——其表现为：以 LSGAN 为 ????，鉴别器 D 对生成样本的评分很低，即 Dfake→0D_{

2021-02-07 15:47:45 3632 19

原创 SVG格式化＜PATH＞说明

<Path="..."/> 用于定义一个矢量形状。字符串中包含的关键命令不外乎：下面的命令中，大写说明后面的数值是绝对位置（Position），小写表示后面的数值是相对于当前的位置（Shift/Offset）.M/m--moveto: 想象【哆啦A梦】，打开【任意门】瞬移到某个位置，因此轨迹是不连续的--格式: `M x y` 或者 `m dx dy`L/l--lineto: 想象【彩虹马】，拖着轨迹走直线--格式: `L x y` 或者 `l dx dy`H/.

2021-01-25 01:09:29 738

原创想在 Ubuntu 上放飞梦想的小黑菜（1）

1. Ubuntu 重启后只有一个贼丑的分辨率2. 安装 driver.runsudo sh NVIDIA-Linux-x86_64-440.31.run --no-opengl-files –no-x-check –no-nouveau-check3. 安装网卡驱动

2020-11-12 11:36:19 373 3

翻译 Understanding the Role of Individual Units in a Deep Neural Networks

写在前面：本文将深度卷积网络的每一层卷积（layer）中的每一个核（filter∈RCin×ks×ks\in \mathbb{R}^{C_{in}\times ks\times ks}∈RCin×ks×ks）看作一个可解释单元（unit），着重探究下面的两个问题：1）对于分类网络这种 downstreaming 的结构，每个 unit 与输入待分类图像之间的关系？2）对于 noise->image 的 GAN，每个 unit 与最终生成图像之间的关系？本文考虑对于复杂场景图像的分类（Pl.

2020-09-19 16:34:16 858

原创论文笔记：Contrastive Adaptation Network for Unsupervised Domain Adaptation

1. 任务设置Unsupervised Domain Adaptation for ImageClassification\rm Unsupervised~Domain~Adaptation~for~Image ClassificationUnsupervised Domain Adaptation for Imag...

2020-03-14 18:33:27 2587 2

原创论文笔记：Cluster Alignment with a Teacher for Unsupervised Domain Adaptation

Profile 最近因为个人需要看了一些 DADADA 和 DRDRDR 的文章。这篇文章比较有意思的是：将聚类设计成目标函数，从而一方面实现经网络抽取特征在分布上的自然聚类，一方面因为特征分布的聚类自然提...

2020-02-20 15:21:53 1502 1

原创论文笔记：Conditional Coupled Generative Adversarial Networks for Zero-Shot Domain Adaptation

本文提出了一个比较有趣的 ZSDAZSDAZSDA（zero-shot domain adaptation）的学习策略。假如现在我们有两个 UIT(Style Transfer)UIT(Style~Transfer)UIT(Style Transfer) 的任务，原本我们可以构建两个 CycleGANCycleGANCycleGAN 就可以解决上面的问题，或者把数据混...

2020-02-01 15:00:04 1037

原创关于深度网络自学习attention mask的随笔

Attention 的出发点是学习一个 scale ，对深度网络的中间特征做线性激活，即：对特征中有利于目标任务（如正确分类）的部分作增强（a>1a>1a>1），对特征中不利于或无关目标任务的部分做抑制（a<1a<1a<1）基于CAM（Class Activation Mapping）的注意力机制借助一个辅助分类器，在 [conv]* -> ...

2020-01-18 00:17:01 1564

原创 Analyzing and Improving the Image Quality of StyleGAN

前言本文围绕2019年上半年的工作 StyleGAN 存在的两个问题进行讨论：Blob Artifacts(液滴伪像)；Shift Invariance(切变不变性)。为了解决这两个问题作者提出了一系列的假设、分析和解决方法。明确 StyleGAN 的问题首先我们需要明确上面提到的两个问题分别是什么？Blob ArtifactsShift Invarianc...

2019-12-15 16:04:01 3266 3

原创 Hello! ImageNet ILSVRC 2012!

Up主作为CV穷人代表，这一次想要触碰一下 papers 里最为活跃却又以 “Huge” 令穷人望而生畏的超级数据集: ImageNet 中的 ILSVRC2012.还记得依靠氪金 “霸道总裁式” 碾压一切 “noise 2 image” 的 BigGAN 吗?来不及时间解释了，快上车！## 下载可怜穷人的 BigGAN-4~8 gpus version>> git cl...

2019-10-12 12:03:50 1607 8

原创论文笔记：Large Scale GAN Training for High Fidelity Natural Image Synthesis

进入正题之前，UP主想要吐槽一下，关于这篇文章的很多博客好多人都是直接记录了前面的部分; 即作者介绍的5个tricks用于高清图像256×256甚至是512×512，然后给了一堆结果。就完了，。那后面的讨论分析呢？？本着一探究竟的蛮劲，UP主特意花了一天的时间去读了这篇博客（这里倒是挺好奇，其他道友读论文的花费时长的●_●）进入主题，下面我们根据文章的组织路线来解读这篇文章。...

2019-10-07 20:34:10 730

原创 Pytorch——DataSet与DataLoader

在使用 pytorch 构建深度学习相关的项目时，通常需要经过【模型结构】-【损失函数定义】-【数据设置】-【训练代码】-【log、验证、可视化与 checkpoints】。其中，【数据设置】往往因为项目/任务的不同，需要自定义合适的DataLoader（数据加载器）。本文即将介绍 torch.utils.data 中的 Dataset 与 Dataloader 的基本用法，以 Unpaire...

2019-09-16 20:43:54 4615 4

原创 CNOCR重训练

前不久在实验室接手一个项目，与甲方几经周旋后给了一个接口，核心部分是yolo3的文字检测与cnocr的文本识别。在文本识别中，由于给的预训练的模型的训练数据集与项目应用的数据分布差距较大（最明显的是识别字符的范围不同），可能需要对模型重新训练。为应对甲方朋友的一时兴起，特意花了一个下午搞清楚如何重新训练。特撰写此博客以作记录。一、重训练cnocr的理由"""识别范围不同，cnocr提供...

2019-08-25 23:38:33 5699 8

原创 U-GAT-IT

论文原文：U-GAT-IT: Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation一、解决的问题——unpaired image-to-image translation1.Selfie2Anime...

2019-08-10 18:44:59 6552 15

原创 EDVR工程代码调试+训练（详细版）

好的，受委托于一个朋友，小编在本文将会以第一人称详细记录EDVR的代码跑通过程。1. 环境配置基于virtualenv的虚拟环境配置见博文vid2vid 代码调试+训练+测试（debug+train+test）（一）测试篇。2. 下载代码$ git clone https://github.com/xinntao/EDVR.git$ cd EDVR这之后我们会处于“…...

2019-07-26 10:20:41 6116 47

原创 EDVR——代码调试+训练

2019年CVPR的文章EDVR: Video Restoration with Enhanced Deformable Convolutional Networks，做的是视频处理（包括视频帧的超分辨率技术与去模糊），从结构上看能够处理应用于任意书品转换的强监督任务；文中最亮眼的地方在于他提出了保证时序一致性（temporal consistency）的新方法，不是使用光流（optical fl...

2019-07-18 13:58:25 8909 14

原创致敬GAN与我最喜欢的框架pytorch

小编从17年暑假开始进入实验室学习，自学了深度学习与机器学习，但理解并不深刻；18年暑假开始从一个师姐手中接下一个课题“线条简化”，但其实做的工作主要是数据集标注与跑实验，尽管最后稍稍改些代码并在论文里提供了几张图，最后的犒劳是“五作（仵作）”；好吧，果然人还是要强大起来，才能获得主动权；19年已经过去了一半，小编才在前不久才更深层次理解了GAN与基于pytorch的实现，复现了2018年传说中的...

2019-07-15 22:03:19 1449

原创 CariGANs: Unpaired Photo-to-Caricature Translation

2018年SIGGRAPH的一篇文章，原文见：CariGANs: Unpaired Photo-to-Caricature Translation。由于时间的关系，小编这里也只贴了我的PPT，完整PPT可以私聊我哈！1.要解决的问题2. 基本思路3. 数据集准备这里有两个主要的问题——1）为什么要自己标记，不用现成state-of-the-art的模...

2019-06-30 18:56:16 1066 21

原创 Image Generation from Layout

2019年CVPR的一篇文章，原文见：Image Generation from Layout，代码见：Codes & Demo。为了节省时间，小编这里仅放PPT的插图。完整ppt可以私我哈！1）要解决的问题2）任务的难点3）关键技术：将具体对象的表示方式解耦，分为确定性的表征基本类别的部分与不确定性的表征具体外观表现的部分。4）合成流程（测试阶段）...

2019-06-12 12:34:01 1639 10

原创 vid2vid 代码调试+训练+测试（debug+train+test）（三）在自己的数据集上训练

话不多说，上代码。# train on 256_g1$ python train.py --name <任务名>_256_g1 --input_nc 3 --loadSize 256 --n_downsample_G 2 --num_D 1 --max_frames_per_gpu 4 --n_frames_total 15 --dataroot datasets/<...

2019-04-24 11:11:16 1749 14

原创 vid2vid 代码调试+训练+测试（debug+train+test）（二）训练篇

### Training### Training with Cityscapes dataset- First, download the FlowNet2 checkpoint file by running `python scripts/download_models_flownet2.py`.- Training with 8 GPUs:（惹不起惹不起）- We adopt ...

2019-04-16 19:54:59 4515 27

原创 vid2vid 代码调试+训练+测试（debug+train+test）（一）测试篇

## Prerequisites- Linux or macOS- Python 3- NVIDIA GPU + CUDA cuDNN- PyTorch 0.4但一般的话我们为了保护已有的环境，通常对于每一个项目新建一个虚拟环境，过程如下：""" Linux 下安装虚拟环境 """# 升级 pippip install --upgrade pip# 安装必要的库sudo...

2019-04-16 14:21:36 6879 44

原创 jQuery作前台，Python3-Flask作后端的全栈开发——数据交互方式

好久没有些博客啦！不行，2019年是追梦的一年！要再接再厉！春节在家，独自完成了数据库大作业的开发，主题是“匠人教程分享与成品线上出售”的网上商城，项目代码见：匠人堂，集齐了：1. 教程编写（图片+文本）；2. 发表评论；3. 点赞功能；4. 在线交易（当然是虚拟货币啦）；5. 教程搜索功能；6. 应用了基于盐值的用户密码（口令）保护性存储方式。先亮个首页截图。...

2019-02-25 00:18:34 1735 8

原创笔记本电脑的键盘突然用不了怎么办(┬＿┬)？！

作为一个铁打的程序员，如果突然键盘用不了，那无异于打断了我们的双手，脑海中一大堆的代码想要溢出却无法打出来，简直无法想象！今天晚上由于手贱下载了个VMware的清理软件，不小心把键盘驱动的注册表信息也删除了，然后就各种GG，瞎紧张了半个多小时，终于做好了！特以此写了一篇博客，压压惊！！第一步，在【开始处】输入regedit，打开注册表。读者会说你不骗我吗？都说了键盘失灵了！还好小编之前装了...

2019-01-21 21:05:17 8394 1

原创论文笔记：Progressive Attention Guided Recurrent Network for Salient Object Detection

标题翻译：基于渐进式注意力指导循环网络的显著性目标检测。梗概：这是一篇结合了注意力机制、循环神经网络、CNN来解决显著性目标检测问题的文章，文中提出的对深度卷积网咯的感知特征做另一种方式的自顶而下（top to shadow）的反馈操作是非常新颖的。关于此文的论文原文与小编的阅读注释，与讲解PPT见：链接：https://pan.baidu.com/s/1KGHrY7deAGdQ6dU...

2018-09-25 21:55:02 2776 1

原创论文笔记：Visual Attribute Transfer through Deep Image Analogy

这是一篇讲解图像类比（Image Analogy）的文章。给定一组图片：A和B'。A提供语义Semantic（“是什么”）和内容Content（如图片的哪个位置会有这个object的什么，其形状和大小是怎样的）两大主要信息，B'则主要提供外观性Appearance（如颜色、光照、风格）和细节（主要是纹理）两个大信息。接下来，我们要做的就是把两张图片都划分为固定大小的patch，然后把色...

2018-09-16 12:43:17 2944

原创 Python使用matplotlib绘制堆积图

堆积图，在计算机视觉的论文中是相当常见而表现力极强的一种图示方法，其表现为：在固定高度的矩形中，根据某一些数值意义相同的不同变量根据其数值大小占据矩形中连续的高度；其与饼图相相似，都可以很清晰地表示不同变量所占比重大小的不同；而它又优于饼图，当我们把不同时间状态下的比较结果拼接起来后，就可以很清楚看到随着时间的演进或者进程的进行，这些变量的权重比例发生的变化和趋势！效果如下——...

2018-08-28 18:48:24 7953

原创基于python-flask搭建后台，HTML+CSS+JS（jQuery）写前端的web全栈开发（三）——3.2 普通按钮点击事件与后台交互

在上一篇文章，我们讲解了基于插件实现的上传图片到后台处理，并将处理后得到的结果图与原图在前端显示。主要idea是将图片先在后台进行缓存，我们传回两张图片的途径，在file的done函数中对<img/>标签的src属性进行更新。但是这样子存在一个问题，就是后台“static/temp/left(right)”文件夹里的图片会越来越多。这时候就是那个subm...

2018-07-16 10:27:45 6161 6

原创基于python-flask搭建后台，HTML+CSS+JS（jQuery）写前端的web全栈开发（三）——3.1 uploadfiles上传图片到后台（显示进度）处理并返回显示

前面小编说这个项目有两个页面，一个是sketch.html定义的介绍实验室项目（包括abstract，paper，framework，code，results等）的纯前端页面；另一个则是demo.html定义的用户成果体验页面。通过点击在sketch.html里的按钮进入另一个页面，要怎么实现呢？上图是sketch.html里的页面跳转按钮！其定义代...

2018-07-16 02:10:09 4519 11

原创基于python-flask搭建后台，HTML+CSS+JS（jQuery）写前端的web全栈开发（二）——2.2 前端动画轮播图实现

在我们浏览过的大多数网页中，轮播图基本上是随处可见的，主要用于网站Home页，作为前端技术的一种，目的是通过简易的动画效果和绚丽的图片吸引用户的眼球！轮播图的效果更是多种多样；在本文，小编主要想分享的是比较基本的版本，因为小编也还只是个小白，刚接触过一个星期；但效果上来看是没问题的！步入正题1. 轮播图的原理其原理是：将一系列待zhan 我们先在上次讲的“templa...

2018-07-15 23:05:14 3373 3

jQuery作前台，Python3-Flask作后端的全栈开发——数据交互方式（项目代码）

Visual Attribute Transfer through Deep Image Analogy（个人阅读与注释）

torch7和Lua训练网络单核内存不够，如何多核训练？

深度学习框架Chainer的权重参数值获取