kasdlj-CSDN博客

原创 1.26笔记

框架：1.多线程，要注意，不同块之间不能共享权重，要分开命名。如果共享的话会改变的，也就是多线程传入每个块会改变这些值，造成bug！！2.还有注意多线程的参数，生存周期，万一外面释放了，里面也做不了的，这个要注意！！优化：1.常用的数就放在循环外面，想办法也要放在外面。2.热循环里面各种精简。如果不方便写neon的话就放到后面，或者其他地方。3.neon和c之间，一些数据要记得往位移的。neon用w来定位的，c如果也用w的话，数据要移位的4.寄存器很多的时候，一定要注意寄存器是否压栈，而且在

2022-01-26 10:54:39 266

原创 ActiveStereoNet: End-to-End Self-Supervised Learning for Active Stereo Systems

Network architectureLoss function主要用的左图与reconstructioned的左图之间的差异，叫做photometric loss，然后亮处像素之间的差异一定会比暗的地方的差异大的。所以像素之间的residual是跟像素的亮度有关。然而，亮度与视差实际上是不相关的。所以，需要消除亮度的影响。因为非监督里面，的确loss是像素之间的loss。Wei...

2018-08-17 09:43:33 1689 2

原创 Learning a Discriminative Feature Network for Semantic Segmentation

创新点就是特征区分网络discriminative feature network，本别叫做平滑网络Smooth Network以及边界网络Border Network。这两个网络可以处理类内一致性以及类间区分性。最终。形成了encoder-decoder网络结构，美其名曰Discriminative Feature Network网络结构红线上采样蓝线下采样绿线不改变特征尺寸，只是信息的传递...

2018-04-27 10:14:36 4477 3

原创 RuntimeError: The size of tensor a (96) must match the size of tensor b (95) at non-singleton dimens

复现PSMNet时候出现的bug。出错在output = model(imgL,imgR)一开始以为左右两图维度不一致。换成output = model(imgR,imgR)之后依旧报错翻墙查阅pytorch资料If two tensors x, y are “broadcastable”, the resulting tensor size is calcul

2018-03-30 14:29:06 26516 18

原创 Pyramid Stereo Matching Network

这篇文章主要有两点，SPP与3d卷积3.1 Network Architecture一般的网络第一个卷积都是用的7×7卷积，因为感受野要大，可是这样子的话计算复杂度较大，本文用三个串联的3×3的卷积去做这样的事情，同样的感受野，计算量大大降低，可以一试。conv0~conv4是残差块用来提取unary feature的。后面就是SPP。用来提取文本信息。再concat左右特征到cost volum...

2018-03-29 20:46:20 2480 7

转载 Adam那么棒，为什么还对SGD念念不忘 (1)

“ 说到优化算法，入门级必从 SGD 学起，老司机则会告诉你更好的还有AdaGrad / AdaDelta，或者直接无脑用 Adam。可是看看学术界的最新 paper，却发现一众大神还在用着入门级的 SGD，最多加个 Momentum 或者 Nesterov，还经常会黑一下 Adam。这是为什么呢？”机器学习界有一群炼丹师，他们每天的日常是：拿来药材（数据），架起八卦炉（模型），点着六味真火（优化...

2018-03-29 14:26:00 3505

转载 Adam那么棒，为什么还对SGD念念不忘 (2)

上篇文章中（ Adam 那么棒，为什么还对 SGD 念念不忘 (1) —— 一个框架看懂优化算法），我们用一个框架来回顾了主流的深度学习优化算法。可以看到，一代又一代的研究者们为了我们能炼（xun）好（hao）金（mo）丹（xing）可谓是煞费苦心。从理论上看，一代更比一代完善，Adam/Nadam已经登峰造极了，为什么大家还是不忘初心SGD呢？举个栗子。很多年以前，摄影离普罗大众非常遥远。十年...

2018-03-29 14:24:16 1586 1

原创 What Makes Good Synthetic Training Data for Learning Disparity and Optical Flow Estimation?

物体形状与动作

2018-03-28 20:56:54 372

原创 EdgeStereo: A Context Integrated Residual Pyramid Network for Stereo Matching

3 Approach先介绍原始的CP-RPN，接着介绍端到端多任务的EdgeStereo，包括HED网络以及CP-RPN与HED之间的关系3.1 CP-RPN三部分：local stereo volume extraction 提取成本向量context pyramid 内容金字塔2-D编解码（残差金字塔）local stereo volume extracti

2018-03-23 09:17:04 1755 4

原创 SGD,Adam,AdaGrad等优化算法

SGD无动量，下降慢，会陷入局部最优点SGD with Momentum有一个动量，一般值为0.9，即0.9的程度考虑以往的方向，0.1程度考虑当前梯度方向。类似高速上开车，大方向不变的同时，微调方向。SGD_NAG万一你陷入局部最优怎么办，周围都是略高的山，所以要爬上去，才能看到更广阔的的世界因此，某个时刻，不计算当前的梯度方向，跟着历史动量走一步，走完之后再根据下一点的

2018-01-26 16:23:39 1049

原创 Deep Stereo Matching with Explicit Cost Aggregation Sub-Architecture

与一般网络的区别普通算法结构与本文算法结构对比。其实这里指的普通结构就是GC-Net。本文网络不同之处就是代价聚合的过程更加牛逼，有aggregation guidance与aggregation proposal，这样聚合之后的代价空间一定是更好哒网络的总体介绍A1就是特征提取，用的是残差双塔结构 A2特征向量构成部分，A3用3D卷积计算特征向量之间的相似度，形成

2018-01-16 18:13:35 1301

原创 Self-Supervised Learning for Stereo Matching with Self-Improving Ability

首先呢，这是一个非监督算法，因此它约束的方式就是左右一致性检测，用warp来处理左右图，详见3.1。作者声情并茂的讲述自己就是不要gt。。网络结构五部分组成特征提取交叉特征向量融合 3D特征匹配 soft-argmin 最后通过图像warp来做约束。特征提取有了特征提取，就可以不虚那些复杂区域啦。以往传统的方法相当于是取像素域的原始特征，而深度学习取得特征则是自己去学的

2017-12-07 16:48:40 2948 7

原创 Unsupervised Learning of Stereo Matching

Cost-volume Computation用对应的分支来计算cost-volume，输入即左右图像，生成cost-volume。这部分是由八个卷基层构成的双塔结构。每个层后面有normalization和Relu层。这些层对两个图像的每个块都会产生特征向量。这些特征向量再进入correlation layer，计算得到cost-volume，这个correlation层就是用的Dispne

2017-10-21 19:33:31 1845

原创 Stereo Matching by Training a Convolutional Neural Network to Compare Image Patches

LeCun经典论文，现在才分析，罪过罪过摘：本文其实通过卷积神经网络得到一个立体匹配成本stereo matching cost，而后面则是一系列的后处理：cross-based cost aggregation, semiglobal matching, a left-right consistency check, subpixel enhancement,a median fil

2017-10-18 11:15:41 2141 1

原创 SGM-Nets: Semi-global matching with neural networks

这是kitti上排名靠前的文章且最近希望能够从传统方法的角度上看看可否突破因此这篇文章必定细读之摘：SGM是一个常用的规范化方法，以其较高的精度以及较快的速率闻名于世。通过改变SGM的惩罚参数来调节视差预测图是否平滑还是不连续，SGM能够取得一个较好的结果。所以要用好非常的不容易而且跟使用者的经验有很大的关系。因此本文提出一种这个参数估计的方法，美其名曰 SGM-Net ，

2017-10-12 16:28:42 2200 6

原创 A Two-Streamed Network for Estimating Fine-Scaled Depth Maps from Single RGB Images

该网络也是注重深度和深度的梯度，将其融合成一个很棒的深度映射。加上一些约束，网络更加不易过拟合，性能更好。该算法很强调结果细节处理，再注意一下regularizer的实现。算法框架如下：可见对于梯度并非如常规算法当中仅在loss部分添加一个约束项，而是另开辟一个分支，单独去学习梯度的特征，单独去对它进行上采样，最后梯度与深度信息进行融合。这两个分支有着同样的形式，一个是图像

2017-09-29 10:56:22 1402 3

原创 Depth Map Prediction from a Single Image using a Multi-Scale Deep Network

这个文章有两个点，第一，基于整张图片进行一个粗全局预测，另外一个是局部优化预测。同时也采用尺度不变性来修正深度。第一部分这个粗预测层，虽然层数比较少，但好歹也是ImageNet 预训练过的。预训练结果当然比随机初始化的要好啦。

2017-09-23 10:17:15 849 2

原创 Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Archit

空闲期，看看论文代码开源：http://cs.nyu.edu/~deigen/dnl/摘要中说，这篇文章是一石三鸟，深度预测，表面估计和语义分析。。。亮点可能就是多尺度了，本来以为要利用语义信息去预测深度。结果并没有。网络结构这个算法结构比较有意思，首先根据整张图片进行粗提取一个全局的输出预测，整个结构是取自于[8]，不过创新就是1，更深了，2，又加了一个尺度，输出尺寸是输

2017-09-22 10:04:49 1194 10

原创 UnsupervisedMonocular Depth Estimation with Left-Right Consistency

为什么能注意到这篇文章呢，因为它是端到端，同时在loss处可以达到左右一致性检测。就是将post-processing结合到了端到端之中。因此，我很注重它的loss。一般接触的算法都是supervise的，就是都需要质量比较好的ground truth。这篇还有个贡献就是不需要ground truth也依旧可以训练。以图像重建loss可以生成disparity。听说结果比supervise

2017-08-03 18:25:24 9767 7

原创 Deeper Depth Prediction with Fully Convolutional Residual Networks

Semi-Supervised Deep Learning for Monocular Depth Map Prediction用的是别人的encoder-deenconder，给大家传递一种监督加上非监督的训练方法，如果样本不够用的时候可以用。没有提供代码。是一种后期进一步优化甚至拓宽应用领域时候可以采用。Deeper Depth Prediction wit

2017-08-01 16:16:00 5317 23

转载 MATH_FUNCTION

主要函数math_function 定义了caffe 中用到的一些矩阵操作和数值计算的一些函数，这里以float类型为例做简单的分析1. caffe_cpu_gemm 函数：template<>void caffe_cpu_gemmfloat>(const CBLAS_TRANSPOSE TransA, const CBLAS_TRANSPOSE TransB, cons

2017-07-14 16:26:57 654

原创 forward

templatevoid caffe_cpu_gemmfloat>(const CBLAS_TRANSPOSE TransA, const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K, const float alpha, const float* A, const float* B, cons

2017-07-12 17:34:43 355

原创 End-to-End Training of Hybrid CNN-CRF Models for Stereo

摘本文模型就是CNN+CRF。CNN提取特征，这些特征用在计算CRF的成本上。本文采用dual block descent 算法来计算图片近似最小化。虽然用的浅层CNN并且对于CRF的输出也没用后处理，依旧抵挡不住本文算法的牛叉。介多层的深度结构利用局部匹配信息形成一个整体。然而，深度CNN模型需要很多后处理，还需要一系列的滤波器和优化启发式的算法才能产生一个能看的结果。本文结合C

2017-07-04 19:37:50 3364

原创 Improved Stereo Matching with Constant Highway Networks and Reflective Confidence Learning

相关工作reflective loss层来检测网络CNN网络性能优劣新网络来代替WTA1.新网络结构，多层多尺度控制网络的接受域2.通过hybrid loss来训练网络获得更好的网络结构性能3.通过CNN得到视差图而不是先前的WTA，4.通过reflective来测量CNN输出准确性5.如何利用confidence score更好的检测异常点并且进行修正6.性能和

2017-06-20 13:37:31 2122 4

原创 FlowNet 2.0: Evolution of Optical Flow Estimation with Deep Networks

最近专心看flownet，在跑代码，但愿有个好结果。如果出问题，应该是delay_mult也设置成10的问题了。训练过程看flownet2论文从图中结果看，flownet2的结果更加平滑，2代相对于1代在质量和速度上都有了显著的提升1.注重了训练样本质量2.提出了网络堆结构，以中间光流状态改变第二张图的形态3.通过引入专门针对小运动的子网络来增强网络对于小位移的性能

2017-06-14 13:36:48 6606 10

原创 Classification and evaluation of cost aggregation methods for stereo correspondence

2.成本聚合阶段的识别尽管一些包含可变支撑的方法限制了成本聚合步骤，只以固定的权重在固定的正方形窗口上。此外，这个基本方法旨在提升准确性同时主要基于提出的一个或两个不同的方法。前者概括说来就是任意形状的可变区域代替了正方形窗口。后者参数是自适应的而不是固定的。这些方法旨在提升算法的准确率，另一方面，这些支撑平面的不规则增加了计算复杂度，提高了运算成本。大多数成本聚合策略是根据两张图的对称策略来

2017-05-26 14:01:21 525

原创 End-to-End Learning of Geometry and Context for Deep Stereo Regression

摘：使用深度特征表示组成成本向量，充分利用3D卷积提取上下文的纹理信息。深度值以差分softargmin操作相规范化，没有额外的预处理或者正则化得到一种端到端的方法介：立体匹配算法应该看重全局，而非局部。本篇展示了如何利用端到端的立体匹配模型，从而理解更加广泛的文本信息3.学习端到端偏差回归

2017-05-23 17:23:37 5595 23

原创 Cross-Scale Cost Aggregation for Stereo Matching

摘：人类根据不同的尺度来处理立体匹配等问题。然而，这种灵感被现如今的成本聚合方法当中所忽视了。本篇论文，将会介绍一个在成本聚合中多尺度相互作用的多尺度成本聚合算法。我们首先从统一优化的角度来形式化成本聚合，表明了不同的成本聚合方法本质上是其核的不同。接着，一种尺度内的规范化将会用在优化上同时解决这种新的优化问题。既然规范化项在相近的核中都是独立的，不同的成本聚合方法能够融入进通用的算法框架、实

2017-05-22 14:18:47 1063

原创 stereovision

85 立体匹配专注于成本聚合策略，评价方法包括only DISC和NON_OCC86 现如今一些相关的成本聚合策略位置形状位置和形状权重这些技术的大多数都使用对称策略来计算支撑平面各种窗口96 分割图片通过相似颜色强度的连接像素所构成的区域而分割开来这对立体匹配中的成本聚合，偏移量优化和差异值检测等等很有用哦

2017-05-18 14:50:30 315

原创 Efficient Deep Learning for Stereo Matching

摘：product layer计算双塔结构网络的内积。问题是多分类识别问题，类别是各种可能的偏移，可以获得矫正得分，与现在的方法相比匹配效果更好。介：以前，给一个左图，然后网络判断右图是不是一个合适的匹配。这是一个二分类。相反，这篇文章设计匹配网络可以产生精确的结果。为了达到这样的效果，产生一个product层来计算双塔结构的两个表示的内积。将此类问题看成多分类问题，每一类都是可能的偏移。

2017-05-16 15:50:48 2316 3

原创 MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

摘：matchnet由块中提取的特征的深度卷积网络构成，还有一个三个全链接层的网络。这三层是计算提取出来的特征的相似度。这篇文章中设计一个统一的方法联合学习块表示和块特征对比。每个块经过卷及神经网络生成固定的代表着SIFT类似的东西。然而，SIFT是在特征层面上以欧式距离来作比较特征。而在MatchNet中，代表以学习到的距离尺度来作比较，作为全连接层。本文贡献：1）设计了一种全新的块对比

2017-05-12 17:26:55 2472

原创 FlowNet: Learning Optical Flow with Convolutional Networks

摘&介CNN一直在识别领域大放异彩，是时候在立体匹配部分展示自己能力了。立体匹配是精确的全像素定位。需要找到两个输入图片之间的关系。不光要学习图像的特征表达，还要学习两图之间的匹配位置关系。光流估计与以往的CNN不同。我们也不确定CNN能否解决这样的问题，因此格外的引入链接层，这个连接层是具有匹配的能力的。算法是训练成端到端的。思路是详尽的利用卷积网络的在不同尺度和抽象层面的强大的特征表示

2017-05-12 15:17:22 2280 1

原创 Computing the Stereo Matching Cost with a Convolutional Neural Network

译：摘要：从矫正的图像对中提取深度信息，训练CNN预测两图如何匹配并且计算立体匹配损耗。成本由交叉成本聚合和半球匹配所改善。介绍：考虑如下问题：两张从不同位置的相机所摄的图像，目标是计算左图每个像素的差异。差异指的是左右两图的水平位置差异d，其中的差异可由深度z（即物体到相机的距离）（公式未知），上述问题变成了立体重建的子问题，即可从一张或多张图片中重建出3D的形状出来，一个典型的

2017-05-10 16:43:45 1972

原创封装

1.对象就是一个东西，类就是有选择的展示对象。类有两个应用方式。一个是new申请内存。有可能申请失败，用->类*P=new 类()if（P==NULL）{}delete p。如果定义的是个数组呢，那么就delete p[]; P=NULL；还有个用栈直接用点就行。还有别人不关心private是什么，你自己看。只关心public。2.string

2016-09-13 11:01:08 292

原创暗黑计划-打牌

将输入字符串变成整数数组int change(char a[10],int a1[10]){ int i,j; for(i=0,j=0;a[i];i++){ if(a[i] == '1'){ a1[j++] = 10; i++; //continue;

2016-09-02 10:34:24 318

原创决策树-模型与学习

决策树是一种基本的分类算法，呈树形结构，优点是具有可读性，分类速度快。1决策树学习通常包括3个步骤：特征选择、决策树生成和决策树的修剪。其描述：从根节点开始，对实例的某一特征进行测试，根据测试结果，将实例分配到它的子节点中。这时，每一个子节点对应着特征的一个取值。直到叶节点。最后将实例分到叶节点的类中。2.if-then规则：路径上内部结点的特征对应着规则的条件，而叶节点的类对应着规则

2016-08-31 21:40:41 410

原创凸优化

1.背景：机器学习当中肯定要设计到一些公式的值的优化，比如说：最小二乘，逻辑回归以及SVM这都是优化问题。直接找到公式的全局最优解是一个非常困难的任务，不过，在这种凸优化问题当中，我们能够在很多场合之下有效的找到全局最优解。凸优化哪里好了，因为凸优化局部最优解就是全局最优解而且凸优化理论有个强大的工具就是Lagrange对偶。2.凸集定义：一个集C，对于任何属于C的x和y，都有ax+(

2016-08-30 21:43:33 1570

原创暗黑计划-框架篇

1.首行输入一个int代表次数t，然后输入t次的string，然后输出相应的答案。#include#includeusing namespace std;string num;int main(){int t; cin>>t; while(t--) {cin>>num;string ans;里面随便搞,由num->ans

2016-08-28 23:13:29 540

原创暗黑计划2-数组，位运算，pair

1.定义某种数组int pad[10][10]={ {0}, {0,1,2,3,4,5,6,7,8,9}, {0,2,3,5,6,8,9}, {3,6,9}, {0,4,5,6,7,8,9}, {0,5,6,8,9}, {6,9}, {0,7,8,9}, {0,8,9}, {9,}};2.位运算2.1 交

2016-08-28 23:09:29 756

原创暗黑计划-字符串

1.字符串string1.1 字符串长度string sint s_len = strlen(s.c_str());1.2 截取字符串的一部分string word = s.substr(起始, 长度);2.map映射,统计字符串个数的时候可以使用mapstring,int> word_count;vectorstring>&

2016-08-26 10:23:29 1175

matlab各种去噪工具箱的应用

matlab基于小波融合的人脸融合

数码管基本知识简介

空空如也