自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 收藏
  • 关注

原创 视频物体分割(Video Object Segmentation)综述

Lucid Data Dreaming for Video Object Segmentation(2019)提出了一种in-domain的traing方法,针对1st fame进行finetune,该方法使用的训练数据大量的减少。对于多物体分割,使用的输入为(4+N)即RGB+segmentation+mask。数据增强的步骤:1.光照的改变2.前景物体的提取3.对前景物体的affine、non-rigid deformations4.相机角度调整5.前景背景融合

2020-08-06 15:11:56 4815 2

原创 keras版本CReLU

将深度学习网络的前几层的卷积结构,换成CReLU可以提升效果。CReLU在pytorch中嵌入非常简单,按照定义和前向推理的方式即可定义CReLU。今天项目需求,在keras上嵌入CReLU,由于对keras用法并不熟悉,遇到了一些困难,发现了一些问题,这里记录。一开始我的写法如下def CReLU(out_channels, input): _x = Conv2D(out_...

2019-10-28 17:22:02 478

原创 关于车辆属性过拟合问题讨论

属性过拟合,原因可能为不同的属性难学程度不一样,讨论后结果如下:1.如果有的属性训练20个epoch就达到好的结果,之后开始过拟合,而同时其他的属性要训练到100个epoch,此时可以在20个epoch停下。至于如何判断是不是20个epoch或者如何判断要停下,需要设计一个停下的机制。2.数据集很重要,筛选数据集,可以先训个网络,不要太多次迭代,把差的数据筛出来3.数据增强。之前疑问是...

2019-07-12 19:35:32 265 2

原创 代码环境移植问题

从P100将CenterNet移植到P4上运行,遇到一些问题,解决起来很棘手,记录下来。P100环境:CUDA 10.0gcc版本 7.3.0pytorch 1.0.1P4原始环境:CUDA 9.0gcc版本 4.8.5pytorch 1.1.0移植步骤:代码拷贝 数据移植 配环境遇到的问题及解决方法:1.运行代码时D...

2019-06-24 12:19:44 1418 2

转载 g++升级

https://www.cnblogs.com/kevingrace/p/9456563.html

2019-06-24 09:16:43 1764

原创 Python一些函数的用法

1.numpy的function函数numpy有一些func函数,这些函数类C,因此速度很快。https://blog.csdn.net/bqw18744018044/article/details/811585032.numpy的arctan函数out = numpy.arctan(x)x可以为numpy值的范围为[-pi/4, pi/4],x为在y轴上的截距,o...

2019-06-17 10:41:12 131

原创 Pytorch 模型fusion

模型A和模型B,两个模型共享backbone,现需要将两模型共享backbone参数backbone为resnet18步骤:1.训练单独的A模型2.load第一步的模型,将backbone中的某些层之前lr调小,之后的lr不变,训练B模型3.load第二步的模型,训练A模型,同时需要固定第二步中某些层的参数trick:1.第2、3步load模型的时候,会有一...

2019-04-18 14:57:06 1032

原创 421. 数组中两个数的最大异或值

下午花了好久理解这道题。。。设置的变量:set:一个set用于存出现的1mask:用来移位temp:用来记录上一次的最大值,加上这次位置的1max:当前最大值这个题用了移位的方法,c++中int位4个字节,32位,而刚好规定数组中最大元素为2^31,所以可以使用一个移位的mask,用来得到每一位。mask的原理是第一次的mask为10000000(...),第二次为...

2019-03-26 18:06:38 514

原创 pytorch的一些用法

日志:https://juejin.im/post/5bc2bd3a5188255c94465d31 lr:optimizer用param_groups来管理参数[optimizer.param_groups],其中保存了参数组和学习率动量等,以dict的形式保存,如optimizer.param_groups['lr'] model.load_state_dict:有...

2019-02-21 11:04:50 140

原创 剑指offer 40

链接:https://www.nowcoder.com/questionTerminal/6a296eb82cf844ca8539b57c23e6e9bf来源:牛客网class Solution {public: vector<int> GetLeastNumbers_Solution(vector<int> input, int k) { ...

2018-12-10 00:23:34 156

原创 Large Kernel Matters论文理解

  Large Kernel Matters ——Improve Semantic Segmentation by Global Convolutional Network发表日期:8 May 2017本文主要提出两种结构,全局卷积网络(Global Convolutional Network,GCN),Boundary Refinement block(BR)GCN同时改善分...

2018-12-05 10:49:19 391

原创 RefineNet论文理解

RefineNet block的作用是把不同分辨率的特征图融合。除了RefineNet-4是单输入,其他全是二输入。主要组成部分是Residual convolution uint(RCU)、Multi-resolution fusion、Chained residual pooling、Output  convolutions.RCU:是从残差网络中提取出来的单元结构Multi-re...

2018-12-04 20:02:00 743

原创 MobileNets论文中可分离卷积

Depthwise Convolutionmobilenet_v1计算flop原本的卷积操作因式分解为一个depthwise convolution和一个1*1的卷积(pointwise convolution),简单讲就是将原来一个卷积层分成两个卷积层,其中前面一个卷积层的fiter都只跟input的每个channel进行卷积,然后后面一个卷积层负责combining。...

2018-12-04 19:29:00 230

原创 Deeplab系列(V1\V2\V3)论文理解

目录Version1Version2Version3Version3+ Version1Pretrained model and prototxt以前网络存在的问题:重复的池化和下采样层组合有平移不变形,其增强了数据分层抽象的能力,但是会阻碍低级的视觉任务(精确定位/抽象的空间关系)。本文结合了深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)...

2018-12-04 17:08:48 3524

原创 SegNet论文理解

SegNet-Turioal 包括prototxt等SegNet的caffe源码 本文也用了vgg16的结构改造的,和U-Net对比,U-Net没有用到conv5和pool5,但是SegNet用到了所有预训练的卷积层权重。当时现有的semantic segmentation的问题在于:最大池化和下采样会降低feature map的分辨率。因而SegNet的新颖之处在于decod...

2018-12-04 11:56:13 867

原创 U-Net论文

   采用了多尺度的方式,该论文提出是用来做医学图像细胞分割的。提出少量样本即可实现训练。1.这个模型的输入image进行了边界镜像处理。2.loss更改因为这里医学图像的细胞边界容易分割错误,因此给边界的细胞线加了权重。权重:分类(softmax):变形的加权交叉熵:3.模型更改这里的是concat,而FCN为add4.数据增强...

2018-12-03 22:24:54 346

原创 FCN论文理解

代码参考准备接触一下图像分割,首先从FCN看起。FCN中主要是进行encoder-decoder的过程,将图像输入conv层得到feature map,再通过upsampling的方式,deconv为和如图图像一样的大小。以vgg16为例,pool层一共有5个,每进行一次pooling操作,因为其stride为2,所以计算后feature的大小就会成为计算前的1/2,所以在pool5输...

2018-12-03 18:04:22 644

原创 image caption(四)文章及代码的一些解析

show and tell是直接调用的LSTMhttps://www.cnblogs.com/wangduo/p/6773601.html?utm_source=itdadao&utm_medium=referral 1.LSTM网络LSTM网络包括的结构为:输入:、输出:其他:由四个主要的门组成第一步:决定从细胞状态中丢弃什么信息,这个过程由忘记门...

2018-11-30 17:20:03 1815

原创 tensorflow学习

1.初始化所有变量同时初始化:init_op = tf.global_variables_initializer()()sess.run(init_op)2.collection集合在Tensorflow中,所有的变量都会被自动加入GraphKeys.VARIABLES这个集合中。通过tf.all_variables函数可以拿到计算图中的所有变量。通过变量声明函数中的train...

2018-11-30 15:43:19 172

原创 Image Caption(三) 一些补充

构建LSTM模型:#定义一个LSTM_celllstm_cell = rnn.BasicLSTMCell(     hidden_size,      forget_bias = 1.0,      state_is_tuple = True )lstm_cell = rnn.DropoutWrapper(        cell = lstm_cell,      inpu...

2018-11-24 11:52:50 210

原创 Image Caption(二) 论文阅读及测试代码

论文为Deep Visual-Semantic Alignments for Generating Image Descriptions,是李飞飞在CVPR2015的论文。实现代码为neuraltalk2,为在GPU上实现。将代码clone下来,并下载model及测试图,按照步骤即可实现eval。复现准备使用show and tell的基于tensorflow的模型,im2txt。...

2018-11-21 19:32:16 1940

原创 Image Caption(一) 论文及理解

准备开始读一下Image Caption,先记录一下对论文的理解,一些公式没有记录下来,在论文中可查。目录1.Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation1. Introduction2.RNN Encoder-Decoder3.Stat...

2018-11-20 19:10:29 1895

原创 深度学习及机器学习的一些问题(面试)

1.为什么正则化可以防止过拟合参考链接 深度学习面试100题:深度学习面试100题(第1-5题):经典常考点CNN深度学习面试100题(第6-10题)深度学习面试100题(第11-15题)深度学习面试100题(第16-20题)深度学习面试100题(第21-25题)深度学习面试100题(第26-30题)深度学习面试100题(第31-35题)深度学习面试10...

2018-11-19 15:55:50 693

原创 深度学习一些网络

一、轻量化网络ShuffleNet MobileNet 二、语义分割网络FCN U-Net

2018-11-19 14:32:58 121

原创 caffe常见的一些错误

跑caffe有些常见的问题,都是工程问题,找起来很麻烦很费时间,为了防止时间久了遗忘解决方法,在此记录。1.出现".py undefine symbol caffe5Zxxxxxx"这种乱七八糟的乱码但是又包含了caffe,这种情况一般是pycaffe的地址没有弄好,解决方法是 export LD_LIBRARY_PATH=caffe/build/lib:$LD_LIBRARY_PATH...

2018-11-09 20:39:59 297

原创 mac ssh连接windows

用mac连接windows,为了方便拷贝文件。windows做服务器端,mac为客户端。Windows上的操作:1.下载软件freeSSHD2.按照默认的方法安装在C盘,在安装过程中, 会跳出是否设置private key的选项,允许设置3.打开freeSSHD软件,此时图标会在桌面操作栏的右下角显示4.双击打开软件,打开到“Server Status”选项卡,会有两个可以点击...

2018-11-07 12:47:26 3697 2

原创 将FPN中的一些层改成C++

因为需要用C++的代码跑测试,因而需要将prototxt中一些原来用python写的层改成c++格式。之前跑faster rcnn的时候,将rpn层参考博客修改过,但是因为对源码不了解,这次改三个层无从下手,下面记录一下过程。需要修改的三个层分别为rpn-data,roi-data和proposal层。rpn-data:layer { name: 'rpn-data' typ...

2018-11-06 18:09:41 360 1

原创 USB检测进度

18.10.24用FPN,backbone是ResNet-50,mAP在0.1下0.8079,0.5下0.7647。FPN的Test和Train的Scales改掉了,因为用原大小显存不够。未判断网络结构是否需要改。可能存在数据泄漏问题,因为在训练集和测试集未分开的情况下做了数据增强。修改方案:1.分开train和test,或者增加test数目2.将FPN加在ResNet18...

2018-10-24 15:49:20 114

原创 小目标检测的一些理解

感受野2017CVPRgithub干货:目标检测对抗网络cvpr 代码1.小目标检测需要高分辨率可以提高输入分辨率SSD对高分辨率的底层特征没有再利用,但底层特征的语义信息少,这两个互相矛盾。另外SSD的anchors设计为0.1~0.2,最小的anchors大小为72,还是太大了。2.feature map不能太小卷积网络的最后一层的feature m...

2018-10-24 15:41:15 6035

原创 faster rcnn分析及其他

最近在跑py-faster-rcnn的代码,终于大概弄懂了结构caffe的可视化网页为指路前期得到feature maps的方法结构主要有ZF和VGG16两种,ZF结构较小,VGG16较大,精度差不多,所以选择占显存小的ZF。两者的区别是conv层不同。faster rcnn由三部分构成:特征提取+RPN+ROI Pooling+Classifier本文以ZF为特征提取网络讲解...

2018-09-12 15:51:50 438

原创 用faster rcnn训练自己的数据集

 一、建立数据集分为三个文件夹JPEGImages、annotations、ImageSets 1.JPEGImages 存放图片,名称以6位数字+.jpg2.Annotations存放xml文件3.ImageSets存放trainval.txt train.txt val.txt test.txt,其中没有xml的文件不需要jpg文件内格式为: jpg...

2018-08-22 17:29:38 785

原创 ubuntu配置

1.IP配置1.配置静态IP和子码掩码有两种方法,一种是命令行配置,这种在重启后会失效,一种是通过文件配置。通过命令行配置:sudo ifconfig eth0 192.168.2.1 netmask 255.255.255.0将IP地址改为:192.168.2.1,子网掩码改为:255.255.255.0通过文件配置:编辑文件 /etc/network/interfacessudo vi /et...

2018-06-26 17:47:04 124

原创 基于truffle的一个DApp——pet-shop

今天测试了pet-shop-tutorial有用的truffle首页:点击打开链接之前的那个区块链指导书写的挺明确的,按照步骤一步步做下来,在最后步骤出了问题,就是只显示标题栏,不显示下面内容。最后查到的问题是因为墙,所以有个文件被挡着了,修改好后的代码在我的github上:点击打开链接放到网上测试的时候还出了个问题,显示“Attempting to run transaction which c...

2018-05-25 10:51:34 880 1

原创 NLP之SiameseLSTM算法

5.12今天交了一下,训练了一个epoch,效果不好,交了一下成绩是05.14今天终于改通了算法,是vocab.size的问题,传的时候给成词典的值了,应该给句子的值,导致eval出问题。训练了一个epoch,效果不好,准备循环100次看一下loss,这里记录一下原理。论文地址:Siamese Recurrent Architectures for Learning Sentence Simila...

2018-05-14 16:40:41 3201

原创 NLP初步学习算法

word2vecword2ve是词聚类模型,是基于上下文的,关注的是词与上下文的共现。算法可以用word2vec+kmeans聚类。LDALDA是主题聚类模型,关注的是词与文章的共现。LDA和doc2vec更与对比性。LDA很耗时,商业不喜欢用。FastText可以参考的博客地址FastText是facebook开源的一个词向量与文本分类工具,模型简单且训练速度快。FastText使用的模型与wo...

2018-05-08 15:38:49 1617 1

原创 NLP问题一些库的学习,tensorflow1.5、keras2.1.6、pytorch0.4.0

tensorflow1.5、keras2.1.6、pytorch0.4.01.tensorflowtensorflow中文文档:链接地址基本使用:使用图 (graph) 来表示计算任务.在被称之为 会话 (Session) 的上下文 (context) 中执行图.使用 tensor 表示数据.通过 变量 (Variable) 维护状态.使用 feed 和 fetch 可以为任意的操作(arbitr...

2018-05-08 13:03:26 1324

原创 点击率 经验

FFM参考文档:https://tech.meituan.com/deep-understanding-of-ffm-principles-and-practices.html数据不均衡即是正负样本的比例相差很大,对于数据不均衡有一些解决方法和经验:1.决策树在样本不均衡的问题上会表现的好2.在划分样本的时候,给较少的样本大的权重lgb_eval = lgb.Dataset( ...

2018-05-04 23:21:03 235

原创 ubuntu联网

ubuntu版本是16.04,没有有线网卡需要联网。首先是用一台机器连接到本Tx1上,互相可以ping通,方法如下:在本机器上用无线网卡联网,查看ipv4地址,使用以下命令:sudo route add default gw 本机ip地址(主机需要开共享才能ping通)做完上面一步,ubuntu板子可以ping通本机,再ping网关地址,查看了一下网关地址是10.10.0.2...

2018-05-02 16:42:44 488

原创 lightGBM 双高

5.1线下0.0364今天加了性别列,很诡异的是明明在预处理的时候,因为nan太多性别列被去掉了,训练的时候却报错'NoneType' object is not iterable不知道怎么解决,把feval注释掉了,果然可以跑出结果5.2线下0.0338把feval和fobj去掉,不知道为什么效果变好了,等着看看线下结果。感觉特征还是太多了,有一个想法是先把所有肯定有用的特征放进去,再随机添加几...

2018-05-01 11:09:47 1486 3

原创 ubuntu中c++调用python

参考自:点击打开链接

2018-04-19 13:29:51 2703 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除