TWSF-CSDN博客

转载 Object Counting and Instance Segmentation with Image-level Supervision

https://arxiv.org/pdf/1903.02494方法以resnet50作为backbone, 两个ouput branches:图片分类:输入C个通道, 每层代表一类目标的分布密度图输出C个通道, 每层代表一类目标的密度1. 损失函数首先对于一张图像, 所有的类别首先分成三类: 0个目标的类别, 含有1-4个目标的类别, 5~目标的类比密度图某个通道的一个像...

2020-03-21 18:03:00 1096

原创 TEDnet

<Crowd Counting and Density Estimation by Trellis Encoder-Decoder Networks>背景介绍类似沙漏金字塔backboe大量的下采样上采样的融合不利于生成精准度密度图, 这源于1)下采样本身导致精准度下降, 2)上采样并不能恢复之前丢失的信息, 即使使用了跳跃连接. 3)还有mse损失针对像素间的损失,忽略了空间信...

2020-03-18 17:58:32 842

原创 SPANet

<Learning Spatial Awareness to Improve Crowd Counting>背景介绍由于人群计数的数据集很难对每个目标提高box, 所以之前的工作都是利用头部中心的位置和高斯分布生成gt.现存的人群计数集中在提供尺度不变的特征表述(那种多列并行的网络), 主要是为了空间感知能力. 在这其中作者发现, 对密度区域估计不足, 对稀疏区域估计过多. ...

2020-03-18 00:20:28 1429 1

原创 vscode通过跳板机(堡垒机)连接remote服务器

先吐槽: 搞了一上午!!! 我太难了!!! 最近服务器不够用, 就差动手算深度学习梯度了!!! 向本科朋友借了几台机子跑, 这要是没上过大学, 研究生还不能毕业了呢!!!目录1. 简单任务介绍2. 本机的配置3. 跳板机的配置4.内网服务器的配置5. 怎么样不需要密码访问嘤嘤嘤~~1. 简单的任务介绍:我现在用的电脑叫做A, 然后借了一台服务器叫做C...

2019-11-18 15:04:30 29556 5

原创 FCOS (ICCV2019)

总结:1. 相当于换了一种形式的anchor, 多层预测, 每层预测指定的尺寸, 然后使用si(也没有讲这个是怎么来的)来平衡尺寸基数.2. 主要困难点在于目标之间overlap的处理和尺寸不变形问题, 可以说两者都是通过FPN处理的,前者假设多数overlap的目标都是尺寸差距较大的, 后者通过每层限定回归范围以及设置si来平衡.3. ICCV2019的, 整篇读下来很顺畅,...

2019-10-13 16:42:45 443

原创 FCOS (ICCV2019)

总结:1. 相当于换了一种形式的anchor, 多层预测, 每层预测指定的尺寸, 然后使用si(也没有讲这个是怎么来的)来平衡尺寸基数.2. 主要困难点在于目标之间overlap的处理和尺寸不变形问题, 可以说两者都是通过FPN处理的,前者假设多数overlap的目标都是尺寸差距较大的, 后者通过每层限定回归范围以及设置si来平衡.3. ICCV2019的, 整篇读下来很顺畅,...

2019-10-13 16:41:57 413

原创 pytorch:模型的保存与加载

有一点错误是, 修改模型之后加载Optimizer错误, 其实我个人认为修改模型之后Optimizer不需要加载预训练的参数, 大家直接删掉那一块就好了. 如果还有错误欢迎留言....

2019-07-05 16:00:37 197

原创 SNIPER: Efficient Multi-Scale Training

conclusion:主要针对小目标检测, 没有提出新的检测算法, 仅仅是对输入图像的一个采样策略.主要思想是尽量让输入训练的一张图像里面的各个目标的尺度在一个范围内, 不要相差太大从而提升性能, 并且不要让那些无关的背景区域也过多的参与训练从而提高效率主要方法是图像金字塔, 定义chip, 就像是滑动窗口, 然后选出一些目标多的窗口chip(对于图像金字塔的每个尺度计算的目标也限定在...

2019-06-27 19:47:46 305

原创 NMS: 非极大值抑制

之前总是对这个东西理解错, 后来看了一遍code, 这次应该不会错~~自己的理解:在nms之前先进行一个大的top-N, nms之后在进行一个恰当的top-N, 这样可以非常好~因为如果不进行后面的top-n 之前过大, 那么后面就可能很多, 之前过小, 那么后面可能就没几个了1. 把框的信息和对应的目标得分传给函数(这里都是目标分数, 多少框多少分数, 不是背景的分数, 仅...

2019-06-08 16:04:36 267

原创 YOLO-V2

1 introduction通过已有的分类数据扩大当前检测系统的范围, 使用目标分类层的分层视图, 将不同的数据集组合在一起.联合训练算法: 分类与检测相结合训练 , 使用标记好的检测数据实现目标的精确定位，利用分类数据提高其识别范围及稳健性.代码:http://pjreddie.com/yolo9000/2 BetterBatch Normalization...

2019-05-13 16:55:13 237

原创 YOLO-V1

1 introduction改善目标检测作为单一回归问题, 直接在整个图像上检测目标的边界框和类别概率相比于其他架构的优点:1: 很快2: 在整个图像上预测, 虽然错误率比Fast R-CNN高, 但是Fast R-CNN在Proposal上预测, 由于缺乏上下文信息, 导致背景的预测错误率是YOLO的两倍.3: YOLO学习对象的一般化表示, 具有通用性, 对于新的domai...

2019-05-13 16:26:44 231

原创 MASK R-CNN

https://github.com/facebookresearch/Detectron.1. 素质四连要解决什么问题？之前的研究使得物体检测、图像分割任务的性能有了很大的提高，但对物体分割任务（instance segmentation）没有很大提升。建立一套基于物体分隔的模型架构。用了什么方法解决？在Faster R-CNN添加了预测mask的部分（与预测bb...

2019-05-06 15:10:12 232

原创 FPN: Feature Pyramid Networks for Object Detection

https://github.com/kaiminghe/deep-residual-networkshttps://github.com/rbgirshick/py-faster-rcnnhttps://github.com/caffe2/caffe2https://github.com/facebookresearch/deepmask1 Introduction...

2019-04-25 17:03:58 368

原创 RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation

conde: https://github.com/guosheng/refinenet1 Introduction主要贡献1 多路径细化网络, 利用多层的抽象特征对于高分辨率语义分割, 网络运用低分辨率语义特征和描绘细节的底层特征去回归方法产生高分辨率语义特征图.2 网络可以进行端到端的训练, 这对于性能非常重要, 网络中使用残量连接和恒等映射, 因此梯度可以直接通过短...

2019-04-23 20:33:14 471

原创 DenseNet: Densely connected convolutional network

贡献和总结1. 使用dense block(3到4个左右), 每个dense里面的每一层和其余任意层都连接, 前面的作为输入, 输出到之后所有的.2. 1X1卷积可以用来改变每一层的输入层数1 introduction设计灵感来自DCNN中信息在长距离传输中可能会丢失.dense block结构是每一层都很其余的层连接: 当前层的输入串联之前所有层的输出特征图, ...

2019-04-22 23:44:34 350

原创 4.22 ~ 4.28 周报

本周学习重点本周学习难点和疑惑下周学习计划本周学习笔记

2019-04-22 23:39:00 156

原创 torch和pytorch安装

torch安装第一步：获取安装LuauJIT（C语言编写的Lua的解释器）和Torch所必需的依赖包。git clone https://github.com/torch/distro.git ~/torch --recursive第二步：刚才默认将依赖包下载在当前路径下的torch文件夹，进入torch文件夹，打开并执行install-deps中的命令。cd ~/t...

2019-04-22 21:21:22 5887

原创 Predicting Depth,Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Archite

Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture主要贡献:使用multi scale训练, 每一阶段的输入都是累加上一阶段的输出和原图像的一层卷积下采样.第一阶段和第二阶段联合训练(感觉就是可以把第一阶段和第二阶段联合在一起...

2019-04-13 22:27:10 2084

原创 Faster R-CNN

AbstractFast R-CNN主要是基于VGG-16而训练的, 训练和测试比R-CNN和SPPnet要快很多.1. Introduction基于目标检测问题的复杂性, 当前模型训练都很慢而且也不优美. 而造成复杂性的原因主要有两点:一是需要处理大量的候选目标区域(也就是proposals). 二是这些候选区域仅仅提供一个粗略的定位, 需要通过改善获得精准定位. 为了解决这两问...

2019-04-09 21:54:16 592

原创 SPPNet: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

Abstract通过空间金字塔的使用, 能够输入任意大小的图像而不需要裁剪, 这样避免了因为裁剪而带来的损失.其次通过卷积计算整个图像的特征图, 然后使用proposal映射特征图提取特征进行后续预测边界框, 使得目标检测的速度比R-CNN提升很多倍.1. Introduction流行的CNN输入都是固定大小的图片, 对于任意大小的图片,当前的解决方法是:1. 裁剪: 这容易导...

2019-04-09 21:37:07 684

原创 DeepLab-V1: SEMANTIC IMAGE SEGMENTATION WITH DEEP CON-VOLUTIONAL NETS AND FULLY CONNECTED CEFs

Abstract通过结合DCNNs(深度卷积网络)和概率图模型解决语义分割问题. DCNN最后一层不足够充分的定位, 无法进行精确的目标分割, 这源于非常固定的属性使得DCNNs对于高层任务性能好. 通过合并DCNN最后一层的相应和一个全连接的CRF克服这个深度网络本地化差的属性.最好的结果是怎么获取的:1. careful network re-purposing2. wavel...

2019-03-31 16:24:44 1197

原创 R-CNN: Rich feature hierarchies for accurate object detection and semantic segmentation Tech report

AbstractRegion with CNN = R-CNNdatasets: PASCAL VOC创新点:(1) 将大容量的CNN应用于定位和检测任务中(2) 对于训练数据缺乏时, 监督预训练作为辅助任务, 接着进行特别域的微调1. Introduction简述CNN发展问分类任务中的CNN多大程度可以应用于目标检测?我们通过缩小图像分类和目标检测之间的差距来回答这个...

2019-03-29 22:49:22 584

原创 ResNet: Deep Residual Learning for Image Recognition

网络:ResNet 结构 Deep 18,32,50,110,1020 Conv Size=3X3(第一层是7X7) Stride=2 Padding 1 ...

2019-03-29 00:14:45 702

原创 zoom-out: Feedforward semantic segmentation with zoom-out features

zoom-out:zoom-out和缩小图形是有区别的. zoom即改变视距. zoom-out是将视距放大, 即离事物远一点去观察事物, 所以事物看到确实会缩小. 另一方面, 计算中的图形缩小却代表的是视距不变, 而是将形状缩小. 对于平面物体两者差别不大, 但是对于一个三维物体, 情况就会不同: 在改变视距的情况下, 在被观察到的物体中, 距离近的大小相对变化大, 距离远的物体相对变化小....

2019-03-29 00:03:15 482

转载 FC-CRF: Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials

参考:https://blog.csdn.net/ahnu120705097/article/details/78913675Abstract传统的图像分割和标记技术是在像素或者图片区域上定义CRF. 虽然区域模型上通常有密集的成对连通性, 但是像素级别的模型一般只允许用在稀疏图结构. 本文是在整个图像上运用全连接的CRF模型(FC-CRF). 结果CRF图模型的边非常多, 不能使用...

2019-03-27 11:20:33 2464

原创 VGG: VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

Abstract:我们的工作是研究更加深的卷及网络对于大规模机器学习的影响. 我们的主要贡献是使用3X3的非常小的卷积层来增加网络的深度改善其性能, 最终的深度在16~19层. 这些发现是基于14年的比赛上的提交, 队伍在目标定位和图像分类方面分别获得了第一和第二.我们同时展示了我们的网络对于别的数据集也有同样的适用性, 他们获得了世界顶尖的水平. 我们已将我们的两种性能最好的Con...

2019-03-27 10:03:34 1170

原创图像分割

function digitalDivide_Callback(hObject, eventdata, handles)% hObject handle to digitalDivide (see GCBO)% eventdata reserved - to be defined in a future version of MATLAB% handles structure

2017-06-07 22:13:51 416

原创 Matlab保存图片背景为透明

图片的透明性，由其属性‘Alpha’ 决定,所以改变图像的‘Alpha‘值则改变透明度Alpha为与图像分辨率相同大小的矩阵，0为透明，1为不透明。保存图片时，如要保存为透明图片，须保存为png格式，保存代码为：imwrite(I,'图像名.png','Alpha',alpha)举例：一张字图片，背景为白色，字为黑色，现在将其处理后，输出为字为红色，背景为透明的图片。代码如下...

2017-05-23 20:34:13 30895 4

转载 python3 怎么安装 PIL

关于Pillow与PILPIL(Python Imaging Library)是Python一个强大方便的图像处理库，名气也比较大。不过只支持到Python 2.7。PIL官方网站：http://www.pythonware.com/products/pil/Pillow是PIL的一个派生分支，但如今已经发展成为比PIL本身更具活力的图像处理库。目前最新版本是3.0.0。Pill...

2017-05-11 17:18:05 151486 12

原创山东省第五届ACM省赛 C - Colorful Cupcakes

4.吃蛋糕 //山东省第五届ACM省赛 C - Colorful Cupcakes/* 题意:n块蛋糕 3种颜色A,B,C 分给一个圆桌n个人相邻两人颜色不同思路:五维数组 1维代表开始的颜色,2,3,4维代表三种颜色使用的次数 5维代表上一次使用的蛋糕是哪一种*/LL num[5][maxn][maxn][maxn][5];int numa, n

2017-05-01 22:20:06 308

原创 POJ 2479 两段最大子序列

/* 题意: 在s串种,求连续的整数和的串s1和s2，s1与s2不相交，使得s1+s2最大思路: 正向dp和反向rev_dp,代表由某一点到i的最大和 dp[i] = max(dp[i- 1] + a[i] 正向sum 和反向rev_sum,代表i点之前(之后)最大的连续字段和枚举1~n点*/dp[1] = a[1];rev_dp

2017-05-01 20:30:25 357

原创图论模板

//TheWaySoFar图论模板一.最短路1.Dijkstra算法(邻接矩阵/邻接表)2.SPFA3.Bellman-ford4.folyd5.次短路6.K短路(Astart + SPFA)二.分图1.染色体判二分2.匈牙利算法三.拓扑排序1.模板(邻接表/邻接矩阵)四.并查集(简单略)五.最小生成树1.prim(邻接表/邻接矩阵)六.网络流1.FF

2017-04-30 20:57:24 377

转载山东省第二届ACM省赛 I - Sequence

题意:n个数划分m组,所有组的和的平方相加最小思路:using namespace std;LL sum[maxn], dp[maxn];int num[maxn];int n, m;int main(){ _; int Test; cin >> Test; while (Test--) { cin >&gt...

2017-04-27 21:51:20 346

原创 codeforces 118D 记忆搜索

题意:n1个仆人,n2个骑士排成一排,不能有连续的k1个仆人,也不能有连续的k2个骑士,有多少种组合思路:记忆搜索,看代码代码:#define LL long long#define maxn 102#define mod 100000000#define INF 0x3f3f3f3f#define Pair pair#define mem(a, b) memset(a, b

2017-04-26 09:44:55 277

原创 codeforces 429B

题目大意：两个人（假设为A，B），打算健身，有N行M列个房间，每个房间能消耗Map[i][j]的卡路里，A起点为（1,1）要达到（n,m）点，且每次只能向右走一步或向下走一步，B起点为（n,1），要达到（1，m），且每次只能向上走一步，或向右走一步。有要求A,B必须在某一个房间相遇一次，且A,B在该房间不再消耗卡路里，因为两人锻炼身体的速度不同，所以在相遇时经过的房间数亦可能不相同。问两人合计最多

2017-04-26 09:40:44 459

原创 vijos1264 lcs+ lis

题意求两个串的最长上升公共子序列思路:if(a[i] == b[j]) dp[j] = maxx + 1.; 其中maxx为 b[j] 代码:#define INF 0x3f3f3f3f#define maxn 505#define Pair pair#define mem(a, b) memset(a, b, sizeof(a))using namespace std;

2017-04-24 11:11:59 211

原创 vijos 1159 深搜 + dp

题意:n种容量的桶,每种无限. 求恰好装满v的缸需要的最少的桶思路:深搜 + DP#define mem(a, b) memset(a, b, sizeof(a))using namespace std;bool flag, dp[maxn];int m, n, v[204], ans[220], sum2;bool judge (int p){ mem(dp, 0);

2017-04-24 10:51:19 303

原创 vijos1037 双塔问题

题意:n个任意高度的水晶,建造两座塔,选取任意快,使得塔尽量高,且塔相等思路:分情况说：第i快石头1、不用：dp[i-1][j]2、放在高塔上：dp[i-1][j-a[i]]+a[i]3、放在低塔上并且放后不超过高塔：dp[i-1][j+a[i]]4、放在低塔上超过了高塔：dp[i-1][a[i]-j]+j代码:#include #define LL lo

2017-04-23 18:52:06 328

原创 POJ 3687 逆向拓扑排序

题意:n个球,m个关系, a b 代表 a 比 b 轻, 按编号1~n输出每个球是第几大,要使得编号小的球排名尽量小. 例如:5->6->1 4->3->2 1号球可以是第3,4,5,6重这里要选第三重, 那么二号球就只能是最重的一个了,即6. 输出答案为:3 6 5 4 1 2思路:反向建立拓扑排序, 则以重的球入度为0开始, 用优先队列每次弹出入度为零编号最大的球即可#define

2017-04-22 15:57:34 349

原创 HDOJ 1532 网络流(FF + EK + Dinic)

题意:由于下大雨的时候约翰的农场就会被雨水给淹没，无奈下约翰不得不修建水沟，而且是网络水沟，并且聪明的约翰还控制了水的流速，本题就是让你求出最大流速思路:套用网络流模板,这篇博文写的质量肯定不好,因为对于这种纯知识点的网络流题目,发表博文更应该注重的是知识点的讲解.这里只是把代码贴上而已.FF代码:#include #include #include #include #inclu

2017-04-19 10:41:38 341

空空如也

空空如也