自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (2)
  • 收藏
  • 关注

原创 训练Stable Diffusion(XL) Lora的图片是否需要caption?

两种方式训练的lora都存在着对某些事物比如青椒无法生成的问题。即使使用较早期的checkpoint-00008也存在同样的问题,调低lora scale到0.6可以得到缓解。从画面质量和文本图片匹配度来看,使用caption的方式训练效果略胜一筹。

2024-03-06 14:34:00 881

原创 图片视频联合编解码器 MAGVIT-v2

2024年年初因为sora的爆火,大家开始对视频生成相关的技术进行广泛的讨论和研究,sora这类视频生成的模型离不开一个重要的组件:一个能高比率压缩且高保真的视频编码器。作者进行了实验,使用VQ的方式随着codebook的增大,重建的能力虽然变强了,生成能力反而变差(想象codebook大到能容纳所有的取值,那就丢失了生成能力)。MAGVIT-v2使用的是一种 LFQ 的变体,它假设码本维度独立和 latent 变量为二进制。(以前基于3D CNN的方法因为3D CNN的特性只能对视频建模)

2024-03-04 23:07:54 1029

原创 Controlnet作者新作-Layer Diffusion

Layer Diffusion提出将透明背景图像的alpha通道图也能在Stable Diffusion的latent space中表示出来,因此可以用SD标准的目标函数进行训练达到文生透明图的效果。这些功能对设计师和游戏厂商有很大的影响,以前为了生成带图层的素材,一般是使用生成结合抠图完成,现在可以一步到位,并且可以精确到发丝的级别。

2024-03-04 20:04:53 395

原创 OCRNet 论文解读

论文:Segmentation Transformer: Object-Contextual Representations for Semantic Segmentation文章提出一种新的目标上下文特征表示方法,方法本质上是用注意力建立点和对象区域的上下文关系。背景和动机获取目标的上下文特征有两种主流方法,一是以ASPP为代表的多尺度模块,ASPP通过对特征图中的点进行稀疏采样获得上下文,这种方式获得上下文既包含前景目标,也可能包含背景。另一种被称为 Relational context,这种方式

2021-11-23 11:03:41 3410

原创 2021 美图CV算法一面面经

记录下来,主要是给自己查漏补缺,也给大家一个面试的借鉴。面试时长90分钟,面试60min+算法题和反问30min,面试官很nice,在面试过程中能感受到他的技术深度和见识广度。实习相关我实习主要做的是机器学习方面,问了我如何设计特征,如何判断特征的好坏等等(不过这些本来就是简历里的东西)论文相关(我是菜鸡~,没有项目)流程大致是:整体介绍,(这个论文是做什么样的任务,达到怎么样的效果)网络设计,(网络如何设计的),面试官是完全明白了我的网络,问我有没有了解过显著性检测里的F3Net,说

2021-11-18 11:04:21 1484

原创 检测中的不平衡问题及解决办法

类间不平衡(class imbalance) 尺度不平衡(scale imbalance) 空间不平衡(spatial imbalance) 多任务不平衡(objective imbalance) 背景-前景不平衡 前景-前景不平衡 目标尺寸不平衡 特征尺度不平衡 定义类间不平衡: 属于不同类别的样本数量差异显著。前景-背景不平衡:正负例样本数量差异显著,比如rpn提出的候选框负例远大于正例。 前景-前景不平衡:检测的目标其出现频率在数.

2021-10-04 10:19:09 1141

原创 关于 Faster RCNN正负样本选取的问题

回顾fast rcnn样本选取问题

2021-10-02 21:58:28 5562

原创 java作用域

java作用域在c++中,这样使用是合法的。因为c++会将较大的作用域隐藏起来。{ int ix = 10; { int ix = 100; }}在java中上述代码是不允许的,因为设计者认为这会导致程序混乱。

2017-09-17 09:36:38 179

转载 结构体中使用string

malloc只是负责申请一块内存,没有任何其他动作。直接声明结构体或者new 一个结构体指针,会调用默认构造函数。如果结构中包含类,同样会调用成员类的默认构造函数。程序中的内存错误是因为使用malloc分配一个结构体内存,但是string是一个类。并没有调用string的构造函数,所以string在malloc之后没有正确构造,导致使用时段错误。下面测试程序前两个直接声明结构体和new出来的,

2017-06-13 12:16:18 4821

原创 图的遍历-广度优先和深度优先遍历

图的遍历概念 从给定图中任意指定的顶点出发,按照某种搜索方法沿着图的边访问图中的所有顶点,使每个顶点仅被访问一次,这个过程就是图的遍历。方法有两种:深度优先遍历(DFS)和广度优先遍历(BFS)。 从顶点0开始进行深度优先遍历,可以得到如下访问序列:0 1 2 4 3 或 0 3 2 4 1。 从顶点0开始进行广度优先遍历,可以得到如下访问序列:0 1 3 2 4或 0 3 1 2 4

2017-06-10 21:25:57 1477

原创 Hanoi问题递归求解

Hanoi问题递归求解问题描述 设有三个分别命名为A,B,C的塔座,在塔座A上有n个直径各不相同,从小到大依次编号为1,2,3,…n的盘片,现要求将A塔座的n个盘片移到C塔座上并仍按同样顺序叠放,盘片移动必须遵循以下规则: 每次只能移动一个盘片;盘片可以放在任何一塔座;任何时候都不能将一个较大的盘片放在较小的盘片上。递归求解思想 欲将A上n个盘片通过B移动到C,可先将A上的n

2017-05-31 22:40:19 1040

原创 C++与Java数组内存的分配

在 C++中,数组要么在静态存储区创建(静态存储区虽然叫“static”,但存在于RAM里),要么就在栈中创建。在栈中创建的数组,数组名就代表着一块内存,注意不是指向,并且在其生命期内它在栈中的地址都不会改变。由于是内存块,因此在C++中使用数组是非常危险的,比如未初始化就使用内存(常规错误),又如程序访问了当前内存块之外的元素,就会造成不可预测的错误。而在Java中,创建一个数组可以

2017-05-22 22:21:30 233

apache-kafka-documentation.pdf

apache-kafka-documentation-cn.pdfapache-kafka-documentation-cn.pdf

2018-01-09

操作系统银行家算法

操作系统 银行家算法 vs2017编写、操作系统 银行家算法 vs2017编写、操作系统 银行家算法 vs2017编写

2018-01-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除