请设置你的昵称-CSDN博客

原创视频物体分割（Video Object Segmentation）综述

Lucid Data Dreaming for Video Object Segmentation（2019）提出了一种in-domain的traing方法，针对1st fame进行finetune，该方法使用的训练数据大量的减少。对于多物体分割，使用的输入为（4+N）即RGB+segmentation+mask。数据增强的步骤：1.光照的改变2.前景物体的提取3.对前景物体的affine、non-rigid deformations4.相机角度调整5.前景背景融合

2020-08-06 15:11:56 4815 2

原创 keras版本CReLU

将深度学习网络的前几层的卷积结构，换成CReLU可以提升效果。CReLU在pytorch中嵌入非常简单，按照定义和前向推理的方式即可定义CReLU。今天项目需求，在keras上嵌入CReLU，由于对keras用法并不熟悉，遇到了一些困难，发现了一些问题，这里记录。一开始我的写法如下def CReLU(out_channels, input): _x = Conv2D(out_...

2019-10-28 17:22:02 478

原创关于车辆属性过拟合问题讨论

属性过拟合，原因可能为不同的属性难学程度不一样，讨论后结果如下：1.如果有的属性训练20个epoch就达到好的结果，之后开始过拟合，而同时其他的属性要训练到100个epoch，此时可以在20个epoch停下。至于如何判断是不是20个epoch或者如何判断要停下，需要设计一个停下的机制。2.数据集很重要，筛选数据集，可以先训个网络，不要太多次迭代，把差的数据筛出来3.数据增强。之前疑问是...

2019-07-12 19:35:32 265 2

原创代码环境移植问题

从P100将CenterNet移植到P4上运行，遇到一些问题，解决起来很棘手，记录下来。P100环境：CUDA 10.0gcc版本 7.3.0pytorch 1.0.1P4原始环境：CUDA 9.0gcc版本 4.8.5pytorch 1.1.0移植步骤：代码拷贝数据移植配环境遇到的问题及解决方法：1.运行代码时D...

2019-06-24 12:19:44 1418 2

转载 g++升级

https://www.cnblogs.com/kevingrace/p/9456563.html

2019-06-24 09:16:43 1764

原创 Python一些函数的用法

1.numpy的function函数numpy有一些func函数，这些函数类C，因此速度很快。https://blog.csdn.net/bqw18744018044/article/details/811585032.numpy的arctan函数out = numpy.arctan(x)x可以为numpy值的范围为[-pi/4, pi/4]，x为在y轴上的截距，o...

2019-06-17 10:41:12 131

原创 Pytorch 模型fusion

模型A和模型B，两个模型共享backbone，现需要将两模型共享backbone参数backbone为resnet18步骤：1.训练单独的A模型2.load第一步的模型，将backbone中的某些层之前lr调小，之后的lr不变，训练B模型3.load第二步的模型，训练A模型，同时需要固定第二步中某些层的参数trick：1.第2、3步load模型的时候，会有一...

2019-04-18 14:57:06 1032

原创 421. 数组中两个数的最大异或值

下午花了好久理解这道题。。。设置的变量：set：一个set用于存出现的1mask：用来移位temp：用来记录上一次的最大值，加上这次位置的1max：当前最大值这个题用了移位的方法，c++中int位4个字节，32位，而刚好规定数组中最大元素为2^31，所以可以使用一个移位的mask，用来得到每一位。mask的原理是第一次的mask为10000000(...)，第二次为...

2019-03-26 18:06:38 514

原创 pytorch的一些用法

日志：https://juejin.im/post/5bc2bd3a5188255c94465d31 lr:optimizer用param_groups来管理参数[optimizer.param_groups]，其中保存了参数组和学习率动量等，以dict的形式保存，如optimizer.param_groups['lr'] model.load_state_dict:有...

2019-02-21 11:04:50 140

原创剑指offer 40

链接：https://www.nowcoder.com/questionTerminal/6a296eb82cf844ca8539b57c23e6e9bf来源：牛客网class Solution {public: vector<int> GetLeastNumbers_Solution(vector<int> input, int k) { ...

2018-12-10 00:23:34 156

原创 Large Kernel Matters论文理解

Large Kernel Matters ——Improve Semantic Segmentation by Global Convolutional Network发表日期：8 May 2017本文主要提出两种结构，全局卷积网络（Global Convolutional Network，GCN），Boundary Refinement block（BR）GCN同时改善分...

2018-12-05 10:49:19 391

原创 RefineNet论文理解

RefineNet block的作用是把不同分辨率的特征图融合。除了RefineNet-4是单输入，其他全是二输入。主要组成部分是Residual convolution uint(RCU)、Multi-resolution fusion、Chained residual pooling、Output convolutions.RCU：是从残差网络中提取出来的单元结构Multi-re...

2018-12-04 20:02:00 743

原创 MobileNets论文中可分离卷积

Depthwise Convolutionmobilenet_v1计算flop原本的卷积操作因式分解为一个depthwise convolution和一个1*1的卷积（pointwise convolution），简单讲就是将原来一个卷积层分成两个卷积层，其中前面一个卷积层的fiter都只跟input的每个channel进行卷积，然后后面一个卷积层负责combining。...

2018-12-04 19:29:00 230

原创 Deeplab系列(V1\V2\V3)论文理解

目录Version1Version2Version3Version3+ Version1Pretrained model and prototxt以前网络存在的问题：重复的池化和下采样层组合有平移不变形，其增强了数据分层抽象的能力，但是会阻碍低级的视觉任务（精确定位/抽象的空间关系）。本文结合了深度卷积神经网络（DCNNs）和概率图模型（DenseCRFs）...

2018-12-04 17:08:48 3524

原创 SegNet论文理解

SegNet-Turioal 包括prototxt等SegNet的caffe源码本文也用了vgg16的结构改造的，和U-Net对比，U-Net没有用到conv5和pool5，但是SegNet用到了所有预训练的卷积层权重。当时现有的semantic segmentation的问题在于：最大池化和下采样会降低feature map的分辨率。因而SegNet的新颖之处在于decod...

2018-12-04 11:56:13 867

原创 U-Net论文

采用了多尺度的方式，该论文提出是用来做医学图像细胞分割的。提出少量样本即可实现训练。1.这个模型的输入image进行了边界镜像处理。2.loss更改因为这里医学图像的细胞边界容易分割错误，因此给边界的细胞线加了权重。权重：分类（softmax）：变形的加权交叉熵：3.模型更改这里的是concat，而FCN为add4.数据增强...

2018-12-03 22:24:54 346

原创 FCN论文理解

代码参考准备接触一下图像分割，首先从FCN看起。FCN中主要是进行encoder-decoder的过程，将图像输入conv层得到feature map，再通过upsampling的方式，deconv为和如图图像一样的大小。以vgg16为例，pool层一共有5个，每进行一次pooling操作，因为其stride为2，所以计算后feature的大小就会成为计算前的1/2，所以在pool5输...

2018-12-03 18:04:22 644

原创 image caption（四）文章及代码的一些解析

show and tell是直接调用的LSTMhttps://www.cnblogs.com/wangduo/p/6773601.html?utm_source=itdadao&utm_medium=referral 1.LSTM网络LSTM网络包括的结构为：输入：、输出：其他：由四个主要的门组成第一步：决定从细胞状态中丢弃什么信息，这个过程由忘记门...

2018-11-30 17:20:03 1815

原创 tensorflow学习

1.初始化所有变量同时初始化：init_op = tf.global_variables_initializer()()sess.run(init_op)2.collection集合在Tensorflow中，所有的变量都会被自动加入GraphKeys.VARIABLES这个集合中。通过tf.all_variables函数可以拿到计算图中的所有变量。通过变量声明函数中的train...

2018-11-30 15:43:19 172

原创 Image Caption（三）一些补充

构建LSTM模型：#定义一个LSTM_celllstm_cell = rnn.BasicLSTMCell( hidden_size, forget_bias = 1.0, state_is_tuple = True )lstm_cell = rnn.DropoutWrapper( cell = lstm_cell, inpu...

2018-11-24 11:52:50 210

原创 Image Caption（二）论文阅读及测试代码

论文为Deep Visual-Semantic Alignments for Generating Image Descriptions，是李飞飞在CVPR2015的论文。实现代码为neuraltalk2，为在GPU上实现。将代码clone下来，并下载model及测试图，按照步骤即可实现eval。复现准备使用show and tell的基于tensorflow的模型，im2txt。...

2018-11-21 19:32:16 1940

原创 Image Caption（一）论文及理解

准备开始读一下Image Caption，先记录一下对论文的理解，一些公式没有记录下来，在论文中可查。目录1.Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation1. Introduction2.RNN Encoder-Decoder3.Stat...

2018-11-20 19:10:29 1895

原创深度学习及机器学习的一些问题（面试）

1.为什么正则化可以防止过拟合参考链接深度学习面试100题：深度学习面试100题（第1-5题）：经典常考点CNN深度学习面试100题（第6-10题）深度学习面试100题（第11-15题）深度学习面试100题（第16-20题）深度学习面试100题（第21-25题）深度学习面试100题（第26-30题）深度学习面试100题（第31-35题）深度学习面试10...

2018-11-19 15:55:50 693

原创深度学习一些网络

一、轻量化网络ShuffleNet MobileNet 二、语义分割网络FCN U-Net

2018-11-19 14:32:58 121

原创 caffe常见的一些错误

跑caffe有些常见的问题，都是工程问题，找起来很麻烦很费时间，为了防止时间久了遗忘解决方法，在此记录。1.出现".py undefine symbol caffe5Zxxxxxx"这种乱七八糟的乱码但是又包含了caffe，这种情况一般是pycaffe的地址没有弄好，解决方法是 export LD_LIBRARY_PATH=caffe/build/lib:$LD_LIBRARY_PATH...

2018-11-09 20:39:59 297

原创 mac ssh连接windows

用mac连接windows，为了方便拷贝文件。windows做服务器端，mac为客户端。Windows上的操作：1.下载软件freeSSHD2.按照默认的方法安装在C盘，在安装过程中，会跳出是否设置private key的选项，允许设置3.打开freeSSHD软件，此时图标会在桌面操作栏的右下角显示4.双击打开软件，打开到“Server Status”选项卡，会有两个可以点击...

2018-11-07 12:47:26 3697 2

原创将FPN中的一些层改成C++

因为需要用C++的代码跑测试，因而需要将prototxt中一些原来用python写的层改成c++格式。之前跑faster rcnn的时候，将rpn层参考博客修改过，但是因为对源码不了解，这次改三个层无从下手，下面记录一下过程。需要修改的三个层分别为rpn-data，roi-data和proposal层。rpn-data:layer { name: 'rpn-data' typ...

2018-11-06 18:09:41 360 1

原创 USB检测进度

18.10.24用FPN，backbone是ResNet-50，mAP在0.1下0.8079，0.5下0.7647。FPN的Test和Train的Scales改掉了，因为用原大小显存不够。未判断网络结构是否需要改。可能存在数据泄漏问题，因为在训练集和测试集未分开的情况下做了数据增强。修改方案：1.分开train和test，或者增加test数目2.将FPN加在ResNet18...

2018-10-24 15:49:20 114

原创小目标检测的一些理解

感受野2017CVPRgithub干货：目标检测对抗网络cvpr 代码1.小目标检测需要高分辨率可以提高输入分辨率SSD对高分辨率的底层特征没有再利用，但底层特征的语义信息少，这两个互相矛盾。另外SSD的anchors设计为0.1~0.2，最小的anchors大小为72，还是太大了。2.feature map不能太小卷积网络的最后一层的feature m...

2018-10-24 15:41:15 6035

原创 faster rcnn分析及其他

最近在跑py-faster-rcnn的代码，终于大概弄懂了结构caffe的可视化网页为指路前期得到feature maps的方法结构主要有ZF和VGG16两种，ZF结构较小，VGG16较大，精度差不多，所以选择占显存小的ZF。两者的区别是conv层不同。faster rcnn由三部分构成：特征提取+RPN+ROI Pooling+Classifier本文以ZF为特征提取网络讲解...

2018-09-12 15:51:50 438

原创用faster rcnn训练自己的数据集

一、建立数据集分为三个文件夹JPEGImages、annotations、ImageSets 1.JPEGImages 存放图片，名称以6位数字+.jpg2.Annotations存放xml文件3.ImageSets存放trainval.txt train.txt val.txt test.txt，其中没有xml的文件不需要jpg文件内格式为： jpg...

2018-08-22 17:29:38 785

原创 ubuntu配置

1.IP配置1.配置静态IP和子码掩码有两种方法，一种是命令行配置，这种在重启后会失效，一种是通过文件配置。通过命令行配置：sudo ifconfig eth0 192.168.2.1 netmask 255.255.255.0将IP地址改为：192.168.2.1，子网掩码改为：255.255.255.0通过文件配置：编辑文件 /etc/network/interfacessudo vi /et...

2018-06-26 17:47:04 124

原创基于truffle的一个DApp——pet-shop

今天测试了pet-shop-tutorial有用的truffle首页：点击打开链接之前的那个区块链指导书写的挺明确的，按照步骤一步步做下来，在最后步骤出了问题，就是只显示标题栏，不显示下面内容。最后查到的问题是因为墙，所以有个文件被挡着了，修改好后的代码在我的github上：点击打开链接放到网上测试的时候还出了个问题，显示“Attempting to run transaction which c...

2018-05-25 10:51:34 880 1

原创 NLP之SiameseLSTM算法

5.12今天交了一下，训练了一个epoch，效果不好，交了一下成绩是05.14今天终于改通了算法，是vocab.size的问题，传的时候给成词典的值了，应该给句子的值，导致eval出问题。训练了一个epoch，效果不好，准备循环100次看一下loss，这里记录一下原理。论文地址：Siamese Recurrent Architectures for Learning Sentence Simila...

2018-05-14 16:40:41 3201

原创 NLP初步学习算法

word2vecword2ve是词聚类模型，是基于上下文的，关注的是词与上下文的共现。算法可以用word2vec+kmeans聚类。LDALDA是主题聚类模型，关注的是词与文章的共现。LDA和doc2vec更与对比性。LDA很耗时，商业不喜欢用。FastText可以参考的博客地址FastText是facebook开源的一个词向量与文本分类工具，模型简单且训练速度快。FastText使用的模型与wo...

2018-05-08 15:38:49 1617 1

原创 NLP问题一些库的学习，tensorflow1.5、keras2.1.6、pytorch0.4.0

tensorflow1.5、keras2.1.6、pytorch0.4.01.tensorflowtensorflow中文文档：链接地址基本使用：使用图 (graph) 来表示计算任务.在被称之为会话 (Session) 的上下文 (context) 中执行图.使用 tensor 表示数据.通过变量 (Variable) 维护状态.使用 feed 和 fetch 可以为任意的操作(arbitr...

2018-05-08 13:03:26 1324

原创点击率经验

FFM参考文档：https://tech.meituan.com/deep-understanding-of-ffm-principles-and-practices.html数据不均衡即是正负样本的比例相差很大，对于数据不均衡有一些解决方法和经验：1.决策树在样本不均衡的问题上会表现的好2.在划分样本的时候，给较少的样本大的权重lgb_eval = lgb.Dataset( ...

2018-05-04 23:21:03 235

原创 ubuntu联网

ubuntu版本是16.04，没有有线网卡需要联网。首先是用一台机器连接到本Tx1上，互相可以ping通，方法如下：在本机器上用无线网卡联网，查看ipv4地址，使用以下命令：sudo route add default gw 本机ip地址（主机需要开共享才能ping通）做完上面一步，ubuntu板子可以ping通本机，再ping网关地址，查看了一下网关地址是10.10.0.2...

2018-05-02 16:42:44 488

原创 lightGBM 双高

5.1线下0.0364今天加了性别列，很诡异的是明明在预处理的时候，因为nan太多性别列被去掉了，训练的时候却报错'NoneType' object is not iterable不知道怎么解决，把feval注释掉了，果然可以跑出结果5.2线下0.0338把feval和fobj去掉，不知道为什么效果变好了，等着看看线下结果。感觉特征还是太多了，有一个想法是先把所有肯定有用的特征放进去，再随机添加几...

2018-05-01 11:09:47 1486 3

原创 ubuntu中c++调用python

参考自：点击打开链接

2018-04-19 13:29:51 2703 2

空空如也

空空如也