自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 资源 (2)
  • 收藏
  • 关注

原创 交叉熵损失分析

交叉熵损失函数分析分类任务是训练神经网络最常用的任务之一。对于分类任务来说,它的损失函数一般采用交叉熵损失函数。至于为什么这样做,本博客在此进行简单的分析。平方损失函数在分类任务上,类别往往属于离散的整形数据(integer)。最直观的想法就是直接使用平方损失函数:L=12∑i=1N(yi−ti)2L=\frac{1}{2}\sum_{i=1}^N(y_i-t_i)^2L=21​∑i=1N​...

2018-12-18 11:11:19 1667 1

原创 边框回归(Bounding Box Regression)详解

Bounding-Box regression最近一直看检测有关的Paper, 从rcnn, fast rcnn, faster rcnn, yolo, r-fcn, ssd,到今年cvpr最新的yolo9000。这些paper中损失函数都包含了边框回归,除了rcnn详细介绍了,其他的paper都是一笔带过,或者直接引用rcnn就把损失函数写出来了。前三条网上解释比较多,后面的两条我看了很多pape

2017-08-31 22:38:05 200436 139

原创 PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection

PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection论文地址 github源码Introduction这篇论文是发表在2016nips上的一篇关于目标检测的论文,在这个论文之前,目标检测我个人看到效果最好的是Faster R-CNN+++(R-FCN的对比试验,+++代表添加了迭代边框回归,上下文信息

2016-12-18 11:07:20 2894 1

原创 Matlab 2014b在Ubuntu14.04安装

Matlab 2014b在Ubuntu14.04安装step 1下载matlab2014b,由于本人是在Windows系统下通过ssh远程登录服务器的,所以需要将文件上传到服务器指定目录下,推荐winscp软件。step 2将上传的iso镜像文件挂在到linux文件目录下。在这里使用mount命令,具体如下: cd /media mkdir matlab sudo mount -o loop

2016-08-17 22:23:00 2634

原创 std::vector的用法优化

std::vector的用法优化背景用法优化示例背景最近看std的库和相关的API文档,然后就直接调用了。感觉自己好像学会了新工具,实际发现写出来的性能和老手相差很大。首先,建议大家看一下操作系统的书,了解什么是堆栈,内存的复制,回收释放等原理,在此基础上,了解std库就会有更深的见解。下面的例子是在Youtube学习编程优化的总结,分享给需要的同行。用法优化示例话不多说,先贴代码:#i...

2019-01-17 10:47:56 1225

原创 使用SSH公钥配置Linux免密登录

使用SSH公钥配置Linux免密登录我们平时都会使用ssh进行远程登录 ssh username@ip,然后输入密码既可以登录成功。但是每次ssh登录,scp远程复制等,都输入密码却相当麻烦。为了解决这个问题,我们可以使用ssh的公钥,配置免密登录。配置过程主要包括以下几步:step 1 使用ssh-keygen 创建公钥ssh-keygen -t rsa 按回车以后可以得到类似以下...

2018-12-30 14:27:42 962

原创 基于深度学习的人脸识别算法

基于深度学习的人脸识别算法简介Contrastive LossTriplet LossCenter LossA-Softmax Loss参考文献:简介我们经常能从电影中看到各种神奇的人脸识别技术,例如图1。人脸识别技术是基于面部特征信息进行身份识别的一种生物识别技术。该技术在图片/视频中,从人脸的角度入手,识别出画面中的人物是谁。如图2所示,严格来讲,这个过程包括人脸检测 (face d...

2018-12-14 20:41:49 29420

原创 Opencv 实现GPU解码

Opencv 实现GPU解码最近一直关注使用GPU解码视频方面的工作。OpenCV已经实现了GPU解码的功能,本文将介绍一下如何使用OpenCV进行GPU解码,可能遇到的BUGs和解码速度分析。实验环境:Ubuntu 16.04, Nvidia K40, CUDA 9.0, OpenCV 3.4, FFmepg 3.3.1, Intel E5-2630 v3 2.4GHz首先需要安装CU...

2018-11-07 15:36:56 10476 3

原创 Vim 录制宏

Vim 录制宏vim中经常存在重复复杂的操作,如果一个一个处理,无疑浪费时间, 这很不程序猿。宏操作就能解决这个问题。宏的实质把一个指令集放到寄存器中,然后调用寄存器的指令。在命令模式下:q+register+一系列命令,register指用户自己定义的a-z中的一个寄存器vim 操作q 完成记录@+register 运行宏修改宏和保存传递宏这块,对初学者基本很少用到。如果vim高手,请参

2017-09-04 11:32:02 930

原创 Vim一键编译运行

Vim 一键编译运行Vim大法好!我平时主要用vim作为IDE写python,c/c++, shell script。但是每次vim编辑完都需要输入wq保存,然后在命令行中执行,发现错误后再次进入源码中修改,如此大大浪费程序猿的时间,生命如此宝贵!以python为例,vim 环境下,在命令模式中输入下命令::!python %即可用python编译当前文件。其他语言同理熟悉IDE的童鞋一般都会使用F

2017-08-30 10:39:43 25500 5

原创 SeLU 激活函数

SeLU最近arXiv出来一篇新文章,102页的Paper,90+页的附录,密密麻麻的公式证明,已经和我暂时绝缘了, 心疼审稿人1秒。虽然看不懂,并不影响我们使用,总结起来就是下图:代码放到Tensorflow里面就下面几行:def selu(x): with ops.name_scope('elu') as scope: alpha = 1.6732632423543772

2017-08-17 15:57:53 17404

原创 YOLO9000: Better, Faster, Stronger

YOLO9000 论文YOLO9000在CVPR2017目标检测领域大放异彩。首先这篇文章没有Related Work给我的第一感觉就是干货满满,这样的好文章当然不容错过。本篇博客,简单的介绍了一下YOLO9000到底采用了哪些技术。BetterBatch Normalization在Google的这篇文章Batch Normalization: Accelerating Deep Network

2017-08-12 12:11:34 9374 5

原创 Action Recognition

Action Recognition最近关注了行为识别的领域,这个领域主要任务是视频分类,输入一个短视频,经过训练出来的分类器,得到正确的类别。但是一个视频如果存在多个行为,那么这个任务将会变成,输入一个短视频,经过预先训练的分类器,不仅要得到每一个行为的类别,还要得到行为开始时间和结束时间。这样,这个任务的难度提高不少,也更具有挑战性。 为了方便大家进行对比实验,我把目前的方法以及效果粘贴出来,

2017-05-24 16:10:58 3675

原创 Improved Techniques for Training GANs

Improved Techniques for Training GANspaper codeIntroduce对抗网络主要有两个应用:半监督学习和生成视觉相似图片。对抗网络的目的要训练生成网络G(z;θG)G(z;\theta^{G}),输入噪声zz生成x=G(z;θG)x=G(z;\theta^{G}),x为一幅图片,并且x满足真实的数据分布pdata(x)p_{data}(x)。判别网络D(

2017-03-02 20:14:32 11494 8

原创 LAPGAN

Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networkspaper codeIntroduce最近几年,对抗生成网络(GAN)在深度学习方面掀起了一股热潮,学术期刊会议上,关于对抗网络的文章层出不穷。从最开始goodfellow的gan,到 LapGan, Adversarial Autoencod

2017-02-22 09:45:13 3195

原创 lua目录操作

Lua 目录操作lua对目录的操作主要依赖lfs库,所以头文件必须要require lfs。lfs库中主要有一下的方法:lfs.attributes(filepath [, aname]) 获取路径指定属性,最常用的就是mode属性,返回字符串为file,directory,link,socket,named pipe,等等。lfs.chdir(path) 改变当前工作目录,成功返回true,失

2017-02-17 11:17:51 9858

原创 Centos 安装cuda

Centos 安装cuda使用runfile进行安装1: 禁用Nouveau驱动,创建文件/etc/modprobe.d/blacklist-nouveau.conf,用vim打开,输入以下内容:blacklist nouveauoptions nouveau modeset=0可以使用lsmod | grep nouveau*查看nouveau是否被禁用。2:重新生成initramfs文件mv

2017-01-16 16:46:14 4285

原创 A MultiPath Network for Object Detection

A MultiPath Network for Object Detection论文地址Introduce本篇论文是Facebook AI的工作,作者改进了目标检测的方法,在COCO数据集上进行实验,相比Seletive Search方法的fast R-CNN,将实验效果进一步提升了66%,在小物体上提高了4倍。作者的改进主要在以下三点:使用skip connections 融合多层的信息。使用

2017-01-14 15:50:54 2282

原创 LVM磁盘格式挂载

LVM 磁盘格式挂载服务器系统崩溃了,需要将磁盘内数据copy出来,但是挂载的时候,发现磁盘系统是LVM格式的,无法直接使用mount命令进行挂载,在查阅了文档以后,发现用下面的方法可以将数据恢复出现。 我原来挂掉的服务器系统为centos 7.0,我将挂掉的磁盘放到了一个ubuntu14.04系统进行恢复数据,主要步骤如下:安装lvm2工具:sudo apt-get install lvm2

2017-01-13 10:17:16 1162

原创 Torch教程(2)-Storage

StorageStorage是lua访存的基本方式,类似c语言的数组,除了可以保存定义的数值,还可以直接把文件映射到内存中进行操作。 Storage主要有以下几种类型:ByteStorage: 无符号char数组CharStorage: 有符号的char数组ShortStorage: short类型的数组IntStorage: int 类型的数组LongStorage: Long 类型数

2017-01-05 15:01:24 2003

原创 Torch教程(1)-Tensor

Torch是一个广泛支持机器学习算法的科学计算框架。易于使用且高效,主要得益于一个简单的和快速的脚本语言LuaJIT,和底层的C / CUDA实现。 核心特征的总结: 1. 一个强大的n维数组 2. 很多实现索引,切片,移调transposing的例程 3. 惊人的通过LuaJIT的C接口 4. 线性代数例程 5. 神经网络,并基于能量的模型 6. 数值优化例程 7. 快速高效的GP

2017-01-04 20:43:08 12191

原创 DEEP COMPRESSION(深度学习网络参数压缩)

DEEP COMPRESSION: DEEP COMPRESSION: COMPRESSING DEEP NEURAL NETWORKS WITH PRUNING, TRAINED QUANTIZATION AND HUFFMAN CODING github 源码地址Introduce本篇论文是ICLR2016年的best paper,主要讲述关于深度学习网络参数的压缩工作。论文主要从下三点出发:

2017-01-02 23:01:32 15866 11

原创 C++多线程处理数据

C++多线程处理数据运行环境OS:centos 7 编译环境:gcc 4.8 CPU: 2颗 Intel(R) Xeon(R) CPU E5-2670 v3 @ 2.30GHz,24核48线程。背景在服务器处理大规模的数据中,使用单线程处理数据,对多核CPU简直是暴殄天物,除非特定情况如在单核单线程测试算法运行时间。 处理任务:处理将近5000个视频的特征 处理目标:充分利用CPU核,多线程

2016-12-29 15:13:41 4223

原创 Instance-Aware Hashing for Multi-Label Image Retrieval

Instance-Aware Hashing for Multi-Label Image Retrieval出版源:《IEEE Transactions on Image Processing》, 2016, 25(6):1-1 论文下载地址Introduce本篇论文是发表在TIP的工作,主要讲述了深度学习在多目标数据集上生成hash code上的应用。深度学习用到的监督信息主要来源于人工标注,但

2016-12-28 22:17:09 1342

原创 G-CNN: an Iterative Grid Based Object Detector

G-CNN: an Iterative Grid Based Object DetectorIntroduce论文下载地址 G-CNN是CVPR16一篇关于目标检测的文章。从2016CVPR的文章可以看出目标检测的新的方法,去除Region Proposals。之前CNN做目标检测的方法,主要是RCNN,SPPNet,Fast-RCNN,Faster-RCNN等,这些方法基本都沿袭下面的思路:Cr

2016-12-09 11:23:08 2119

原创 Factors in Finetuning Deep Model for Object Detection with Long-tail

Factors in Finetuning Deep Model for Object Detection with Long-tail论文下载地址 第一次看到Long-tail这个字眼是在一本经济学的书本上,由美国经济学家克里斯·安德森提出。最近看CVPR16看到一篇关于Long-tail的文章,看到名字就被吸引了(论文起一个好名字很重要),很想知道长尾理论在深度学习的finetunning中有

2016-12-06 17:23:01 1898

原创 R-FCN: Object Detection via Region-based Fully Convolutional Networks

R-FCN: Object Detection via Region-based Fully Convolutional Networks论文下载地址 源码地址 本篇论文是微软亚研何凯明代季峰的团队做的工作,虽然何凯明16年去了facebook,但是相关工作还在进行,代码还是公布在github上。感兴趣的可以从链接下载源码进行分析测试。Introduce论文主要提出了一种利用全卷积网络进行目标检

2016-11-30 20:15:37 5632 3

原创 Vim 添加删除多行注释

VIM 如何添加删除多行注释添加注释step 1: CTRL + V 进入visual block 模式step 2: 移动光标,选中多行的开头step 3:选择完毕以后,按大写的I键,提示进入insert模式,输入插入的字符step 4:最后按ESC键,多行代码就可以注释删除注释CTRL + v 进入列选择模式,移动光标把注释符选中,按下d,注释即可删除

2016-11-25 10:27:41 506

原创 SSD: Single Shot MultiBox Detector

SSD: Single Shot MultiBox Detector论文解读论文下载地址 github源码地址背景CVPR2016,在目标检测的领域上,RGB大神又参与了YOLO的工作,提出了一种新的目标检测的思路。YOLO的方法有了一个明显的优点就是速度很快,能达到45FPS,并且保持mAP63.4的精度。这种方法的提出,为实时性目标检测提供了可能,但是缺点也很明显,就是精度比较低,之前的方法F

2016-11-22 21:06:47 5595 7

原创 YOLO 论文解读

You Only Look Once:Unified, Real-Time Object Detection论文下载地址 github源码地址简介YOLO是2016年CVPR的paper,这是RGB继RCNN,fast-RCNN,faster-RCNN以后,又一力作。针对目标检测中,无法实现实时性检测的问题,独辟蹊径,开创了目标检测的新思路。在RCNN中,作者将目标检测的问题转化到分类上来,提出了

2016-11-16 09:29:20 16075 4

转载 基于深度学习的目标检测研究进展

之前在深度学习大讲堂上看到了一篇师兄写的文章,膜拜师兄的同时转载一下。前言开始本文内容之前,我们先来看一下上边左侧的这张图,从图中你看到了什么物体?他们在什么位置?这还不简单,图中有一个猫和一个人,具体的位置就是上图右侧图像两个边框(bounding-box)所在的位置。其实刚刚的这个过程就是目标检测,目标检测就是“给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个

2016-11-13 20:09:34 2216 1

原创 Fast-RCNN

Fast-RCNN论文下载地址 github网址简介首先膜拜一下RBG大神,RBG大神不仅是学术的大牛,工程也是大牛,代码写的很漂亮。这篇论文主要参考的是RCNN和SPPNet。需要按照这个顺序进行看paper,RCNN -> SPPNET -> Fast-RCNN -> Faster-RCNN。CNN在分类上效果很好。RNN就解决了为什么不把目标检测的问题转化到分类的问题上呢?Fast-RC

2016-11-06 16:32:03 3610 1

原创 Linux C++ 查看目录下所有文件

Linux C++ 查看目录下所有文件简介最近写程序总会用到频繁的读取目录下所有文件的操作,一直用C++写代码,为什么不封装成一个简单的类呢?然后打包成一个动态库或者静态库那么将会大大的方便代码的重用。于是动手写了下面的代码。能用给大家带来帮助将是我的荣幸,同时也希望大家能够尊重作者的劳动成果,不要随意转载。主要函数先简单的介绍一下用到的函数:lstat 函数:#include<unistd.h

2016-11-04 10:33:19 2588

原创 Deep Learning of Binary Hash Codes for Fast Image Retrieval

Deep Learning of Binary Hash Codes for Fast Image Retrieval论文下载地址 这是一篇台湾中研院发表在CVPR2015年的文章。 之前deep hash,一般来说,网络根据图像的label,输入一个二元组或者三元组,利用CNN网络提取出图像的特征,根据相同的label应该具备比较接近的海明距离作为网络的优化目标,然后提出一种新的目标函数,采用

2016-11-02 20:18:09 1763 2

原创 git常用命令

git 使用手册第一章 git安装第一步:安装ssh sudo apt-get install ssh第二步:客户端使用ssh 建立 公钥 和私钥ssh-keygen [-t rsa|dsa] //两种加密方式这里使用默认的rsa加密ssh-keygen 一路enter第三步:将客户端的公钥拷贝到服务器制定的目录下ssh-copy-id 本地目录 user@host第四步: 安装git

2016-10-28 17:24:41 331

原创 Simultaneous Feature Learning and Hash Coding with Deep Neural Networks

Simultaneous Feature Learning and Hash Coding with Deep Neural Networks论文下载地址 自从2014年中山大学潘炎老师讲deep hash搬上舞台以来,关于deep hash的paper如雨后春笋般喷薄而出。本文也是潘炎老师15年参与发表的一篇paper,和之前的deep hash方法相比,本篇论文还是和先前的论文有着明显的改进。

2016-10-23 22:15:57 3170 1

原创 Feature Learning Based Deep Supervised Hashing with Pairwise Labels

Feature Learning Based Deep Supervised Hashing with Pairwise Labels现在实验室要求每周阅读一篇paper然后写成总结,作为一个博客的受益者,我也想写成博客的形式,将收获不局限于分享在小组内。但是,作为一个知识的传播者,如果传播错误的知识误导别人还不如不做。所以写每一篇博客都是忐忑不安,特别是国内一些厉害课题组的发表的paper,生怕误

2016-10-17 16:36:11 4618 2

原创 Deep Hashing Network for Efficient Similarity Retrieval

Deep Hashing Network for Efficient Similarity RetrievalIntroduce这是发表在AAAI-2016的一篇paper,下载地址 在本篇论文之前的监督Hash方法,第一步通过手动学习或者机器学习得到特征向量,第二步学习二进制的Hash Code。然而,这种方法存在明显的缺点,首先提取的特征并不一定完善,并且学习的二进制的Hash Code也有量

2016-10-11 20:26:22 4450 1

原创 静态链接ffmpeg库

ffmpeg静态链接在音频视频编解码中,经常使用ffmpeg库。平时都是使用的动态库,但是动态库有一个缺点,就是程序运行时才进行加载。如果你需要经常移植的情况下,每次都需要重新的编译动态库,比较麻烦。并且,如果你使用的库只有你自己的程序使用时,那么系统只会有一个副本,所以动态库的优点并没有体现出来,倒不如使用静态库省事。 但是直接修改原来的makefile以后,发现并不能正常运行,链接时候出现了很

2016-10-10 17:29:44 4521 1

原创 ffmpeg在Ubuntu14.04源码安装

ffmpeg在Ubuntu14.04源码安装准备工作平台:Ubuntu 14.04 从官网下载指定版本的ffmpeg文件或者使用git clone从github上下载源码。获取依赖在这里需要安装一些ffmpeg所需要的依赖sudo apt-get updatesudo apt-get -y install autoconf automake build-essential libass-dev

2016-10-09 15:48:24 954

图片去除黑边程序

去除原图像的黑边,然后保存为去除以后的图像,实用于视频解码预处理阶段。

2016-11-28

opencv全景图拼接

使用opencv stitcher进行图像拼接。

2016-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除