自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(230)
  • 收藏
  • 关注

原创 Multi-task Learning

Deep Learning 回顾之多任务学习 https://www.52ml.net/20775.html?utm_source=tuicool&utm_medium=referral深度神经网络的多任务学习概览(An Overview of Multi-task Learning in Deep Neural Networks)https://www.cnblogs.com/...

2018-01-19 09:44:59 2895

原创 数据库

人脸数据库 关注博客:http://haoxiang.org/2013/12/face-recognition-detection-database/香港的CelebA: http://mmlab.ie.cuhk.edu.hk/projects/CelebA.htmlWIDERFACE: http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/

2015-12-29 16:40:23 1785

原创 开源代码文献

持续跟新Tracking: Learning to Track: Online Multi-Object Tracking by Decision Making ICCV2015 使用 Markov Decision Processes 做跟踪,速度可能比较慢,效果应该还可以 https://github.com/yuxng/MDP_Tracking Car detection: Int

2015-11-18 08:42:39 23687 2

原创 【疲劳驾驶】Driver Fatigue Detection Based on Residual Channel Attention Network and Head Pose Estimation

提出RCAN网络,用于识别眼睛和嘴巴的状态。将眼睛闭合率(PERCLOS)和嘴巴张开程度(POM)用于疲劳检测,并提出PnP方法估计人头姿态辅助疲劳检测。3D人头姿态估计和疲劳检测基于深度学习实现。方法包含三个方面:人脸状态识别,人头姿态估计,和疲劳分析。首先使用Retinaface检测人脸,并标记人脸框、眼睛区域和嘴部区域。...

2021-12-06 15:19:15 1879 1

原创 PointAugment:一种自动增强的点云分类框架

PointAugment的点云分类框架,当训练分类网络时,该框架会自动优化和扩充点云样本以丰富数据多样性。与现有的2D图像自动增强方法不同,PointAugment具有样本感知功能,并采用对抗学习策略来共同优化增强器网络和分类网络,学习生成最适合分类器的增强样本。PointAugment根据形状分类器和点位移来构造可学习的点增强函数,并根据分类器的学习进度精心设计损失函数以采用增强样本。Point...

2020-03-13 10:59:57 1199

原创 图像变换

图像变换包含内容:等距变换、相似变换、仿射变换、投影变换相关链接:https://blog.csdn.net/raby_gyl/article/details/52780644https://blog.csdn.net/KinboSong/article/details/64923831https://blog.csdn.net/aiwoshan0908/article/detail...

2019-09-03 10:29:25 469

原创 内存图片二进制数据直接转为 OpenCV 数据格式的方法

想了多种方法解决这个问题,还是百度的力量大。 在很多应用中,经常会直接把图片的二进制数据进行交换,比如说利用 socket 通信传送图片二进制数据,或者直接用内存数据库(例如 Redis)来传递图片二进制数据。 这个时候,当你的应用程序读到内存里的二进制图片数据时,怎么样直接转为OpenCV 可以使用的图片格式呢,答案是用 cv::imdecode 这...

2019-07-18 17:12:06 3809 3

原创 3D卷积“LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks”

LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks3D卷积计算量大,消耗内存多,论文提出了修正的局部相量(ReLPV)模块替换标准的3D卷积,在3D局部邻域(3×3×3)内提取输入特征图每个位置的相,获取特征图。这个相是通过计算每个位置3D局部邻域内多个固定的低频点的3D短时傅里叶变换(STFT),不同频域点的...

2019-07-05 12:04:00 1247

原创 点云卷积“PointConv: Deep Convolutional Networks on 3D Point Clouds”

PointConv: Deep Convolutional Networks on 3D Point Clouds参考借鉴了https://baijiahao.baidu.com/s?id=1631407236773911746&wfr=spider&for=pc与在致密网格中的图像不同,3D点云是不规则且无序的,论文提出了PointConv,将卷积核看作3D点局部坐标的非...

2019-06-28 18:20:28 2689 1

原创 迁移学习“Importance Weighted Adversarial Nets for Partial Domain Adaptation”

Importance Weighted Adversarial Nets for Partial Domain Adaptation提出重要性加权对抗网络用于非监督的域适应,主要针对目标域相比源域具有的类别数较少的部分迁移学习。该网络目的是从源域中找到极有可能是outlier类别的样本。这是与SAN类似的一篇文章,做部分域适应工作。目标域中无标记样本,且类别数目未知,通常假设源域足够大,包...

2019-06-19 17:50:52 784

原创 迁移学习“Partial Transfer Learning with Selective Adversarial Networks”

Partial Transfer Learning with Selective AdversarialNetworks摘要:对抗学习应用于深度网络中学习可迁移的特征初有成效,它降低了源域及目标域之间的分布差异。目前已有的对抗网络假设源域和目标域共享全部的标记空间。在迁移过程中,源域中类别往往很多,而目标域通常只和源域其中一小部分相关,直接迁移肯定会产生负迁移的影响。论文提出了部分迁移学习...

2019-06-18 15:36:08 1827

原创 ubuntu 下 python 调用 c++ 错误问题解决

ImportError:/home/whut/anaconda2/bin/…/lib/libgomp.so.1: version GOMP_4.0' not found libstdc++.so.6: versionGLIBCXX_3.4.21’ not found首先查看一下是否真的不存在strings /home/whut/anaconda2/bin/…/lib/libgomp.so.1...

2019-05-05 15:26:13 1168

原创 git简单命令

查看自己的用户名和邮箱地址:  $ git config user.name  $ git config user.email修改自己的用户名和邮箱地址:  $ git config --global user.name "xxx"  $ git config --global user.email "xxx"我们创建dev分支,然后切换到dev分支:git checkout -b...

2019-01-22 10:34:12 299

原创 人脸识别“A Discriminative Feature Learning Approach for Deep Face Recognition”

Source code: https://github.com/ydwen/caffe-faceFaceNet: https://github.com/davidsandberg/facenet相关的blog:https://blog.csdn.net/dongfang1984/article/details/53337195摘要:提出了centor loss用于增强特征的可分辨性,c...

2019-01-22 10:28:28 244

原创 L2-constrained Softmax Loss for Discriminative Face Verification

摘要:softmax损失优化出来的特征不具有较高的类内相似度得分及较低的类间相似度得分。论文增加了特征描述子的L2约束,使得特征分布在具有固定半径的超球上。 大多数现有的使用softmax损失训练的DCNN方法倾向于在高质量的数据上过拟合,对于困难人脸常分类错误。作者通过观察发现,softmax损失学习到的特征的L2-norm是人脸图像质量的反映,高质量的人脸具有较大的L2-norm,模糊...

2019-01-22 10:28:07 1668 1

原创 三元组损失“Deep Metric Learning via Lifted Structured Feature Embedding”

http://www.cnblogs.com/wangxiaocvpr/p/5921074.htmlcaffe实现解释:https://blog.csdn.net/zziahgf/article/details/78568696tensorflow实现:http://10.1.2.209/lianjie/install-packages/blob/master/metric_loss_op...

2019-01-22 10:27:10 1295

原创 人脸检测“Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks”

源码:https://github.com/Jack-CV/PCN-FaceDetection提出了PCN网络检测任意角度的人脸,网络分为三级,首先将任意角度人脸从[-180°,180°]转到[-90°,90°],第二级将人脸转到[-45°,45°]范围,第三步将人脸转为正脸,示意图为:PCN网络进行具有三个任务:人脸/非人脸分类,bbox回归,以及角度标定,损失函数为:三步P...

2018-11-01 11:36:10 623

原创 人脸识别“NormFace: L 2 Hypersphere Embedding for Face Verification”

源码地址: https://github.com/happynear/NormFace研究了特征归一化方法用于增强人脸验证性能,同时提出了两种适应于归一化特征训练的两种策略:基于优化余弦相似度改进的softmax损失,改进的度量学习方法。在人脸验证中,余弦距离或者L2归一化的欧式距离通常用来衡量特征间的相似度,余弦距离相当于归一化的两个向量的内积。但在CNN的训练中,内积运算通常不进行归一...

2018-10-31 10:41:09 847

原创 深度嵌入学习“Sampling Matters in Deep Embedding Learning”

知乎专栏:https://zhuanlan.zhihu.com/p/27748177在检索和验证任务中,经常使用contrastive 损失或 triplet损失作为损失函数,大多数论文也主要关注如何选取损失函数,这篇论文认为训练样本的选取也很重要。提出了distance weighed sampling,选取信息量更大更稳定的训练样本。此外,提出了margin based loss,效果更好...

2018-10-25 17:42:30 3300

原创 三元损失“In Defense of the Triplet Loss for Person Re-Identification”

更全面的阅读记录可以参考这篇博客:https://blog.csdn.net/xuluohongshang/article/details/78965580背景描述提出了一个三元损失的变形用于行人再认证。近期较为成功的行人再认证方法一般使用分类损失结合验证损失。先使用分类损失训练,然后使用网络的一部分进行特征提取,结合度量学习获得最终的特征描述。存在问题:分类损失在id数量增加是,需要...

2018-10-24 16:23:27 2248

原创 DeepID2 "Deep Learning Face Representation by Joint Identification-Verification"

降低类内方差,提升类间方差一直是人脸识别的热点。论文将人脸识别和验证损失同时监督网络的训练,在LFW上获得99.15%的验证准确率。人脸识别是对输入图像分类,验证是判断一对图像是否为同一个ID。分类信号具有丰富的ID相关信息,或者类间方差,但分类信号对于相同ID的约束较小,即不同的特征可能映射到相同的ID上。这时当特征推广到新任务或者新ID时表现就不好。因此,论文增加了人脸验证信号的监督,要求...

2018-10-23 11:12:55 384

原创 MegDet: A Large Mini-Batch Object Detector

分类网络如ReseNet-50的mini-batch尺寸已经很大了,如8192或16000.但检测网络的mini-batch尺寸确很小,如2-16。小的batch尺寸有什么问题?一是训练时间长,二是无法为BN提供精确的统计信息。三是正负样本比例不平衡,如下图a-b所示。但是直接增加batch尺寸有什么问题呢?大的batch尺寸需要比较大的学习率去保持精度,但大的学习率通常会导致无法收敛。为...

2018-09-19 15:49:37 428

原创 目标检测“Cascade R-CNN: Delving into High Quality Object Detection”

目前的目标检测器主要使用IOU=0.5定义正负样本,这通常会产生很多接近负样本的检测结果。但检测性能又会随着IOU的提高而下降,主要是由于:1)IOU提高,正样本数量减少,出现训练过拟合;2)检测器最优时IOU与输入假设时inference-time不匹配。论文提出Cascade RCNN解决这个问题,包含多级检测器使用上升的IOU训练。IOU=0.5训练,会生成较多的噪声框,如fig1(a)...

2018-09-06 16:27:44 993

原创 姿态估计“2D/3D Pose Estimation and Action Recognition using Multitask Deep Learning”

提出了用于2D/3D姿态估计,及行人行为分析的多任务框架。姿态估计一般做的事热点估计,需要使用argmax函数复原坐标,破坏了端到端的BP链。姿态估计使用回归的方法,扩展Soft-argmax函数用于处理2D/3D姿态回归。姿态估计网络包括K个预测块,用于调整姿态,最后一个预测是姿态的估计。低层的视觉特征是副产物,姿态回归结构如下所示:soft-argmax层,对于2D热力图输入,...

2018-08-27 11:03:24 3220 1

原创 行人姿态估计源码AlphaPose

机器环境:ubuntu16.04,cuda8.01.torch&tensorflow 版本源码地址:https://github.com/MVIG-SJTU/AlphaPose首先跑的是torch版本,安装了torch和tensorflow后运行程序出现如下错误:Error in `python2': corrupted size vs. prev_size: 0x0000...

2018-08-27 09:04:06 4545

原创 多人姿态估计“Cascaded Pyramid Network for Multi-Person Pose Estimation”

**提出目的**多人姿态估计主要的挑战来自被遮挡的关键点、不可见的关键点及复杂的背景。论文设计了级联金字塔网络(CPN)用于解决这种问题。算法包含GlobalNet和RefineNet两步。基于FPN,GlobalNet用来检测简单的关键点,RefineNet使用在线关键点挖掘损失检测困难度关键点。应用:行为识别,人机交互。主要方法:自下而上的方法:DeepCut, DeeperCut...

2018-07-23 16:09:59 1230

原创 Multi person-pose estimation

几篇人体关键点检测的论文一、Mask R-CNNMask R-CNN Mask R-CNN同时进行目标检测和实例分割,在Faster-RCNN框架基础上增加mask分支,多任务损失为: L=Lcls+Lbox+LmaskL=Lcls+Lbox+LmaskL=L_{cls}+L_{box}+L_{mask} 对于每个RoI,mask分支有Km2Km2Km^2维的输出,表示K个分辨率为m...

2018-04-13 11:13:10 976

原创 姿态估计及跟踪“Detect-and-Track: Efficient Pose Estimation in Videos”

基于行人检测和视频理解,估计及跟踪人体关键点。首先在单帧或短视频剪辑估计关键点,然后使用轻量级网络生成关键点的估计。单帧的估计使用Mask-RCNN,3D Mask-RCNN。在PoseTrack上对比,MOTA为51.8%。相关工作 单帧图像姿态估计:Mask R-CNN,DeeperCut,[4][33] 多帧姿态估计:PoseTrack[22],[18] 视频多目标跟踪:递归神经网络[3

2018-04-09 16:24:47 5769

原创 姿态跟踪“Pose Flow: Efficient Online Pose Tracking ”

复杂场景下多人关节姿态跟踪,论文设计了一个在线的优化网络建立帧间姿态关系,并形成姿态流,此外设计了一个姿态流非极大值抑制减少冗余姿态流,重新建立时间上不相交姿态的联系。实验在两个姿态跟踪数据库上Pose Tracking datasets([Iqbal et al., 2017] and [Girdhar et al., 2017])对比。多人姿态跟踪方法分两种,自上而下的和自下而上的。自上而下的...

2018-03-16 14:21:11 2958 2

原创 人体姿态”RMPE: Regional Multi-Person Pose Estimation“

多人姿态估计新兴研究方向,论文方法RMPE包含三个部分,即,对称空间变换网络(SSTN)、参数化的姿态非极大值抑制及姿态引导的proposal生成器(PGPG)。多人姿态识别的方法有两步结构、part-based的结构两种。其中两步结构首先检测人体bbox,之后在每个box内独立估计姿态。part-based结构首先检测人体部件,然后组装检测到的人体部件形成多人姿态。论文的方法是两步法,目标是在bb

2018-03-01 18:04:29 888

原创 多任务学习“DEEP MULTI - TASK REPRESENTATION LEARNING : A TENSOR FACTORISATION APPROACH”

多任务深度学习结构通常是一个黑科技,由设计者决定哪些层共享。论文在深度网络的每一层学习任务间的共享结构,基于矩阵分解泛化技术进行tensor分解,实现端到端的深度网络信息共享。该方法可以用于同类和不同类的多任务学习。由设计者定义的深度多任务网络通常在浅层共享,之后分叉成多个分离的层,每个任务都有损失函数。设计者通常需要明确共享结构:有多少个特定任务层,多少个任务不相干层,如果设计共享结构等问题。论文

2018-01-02 17:10:29 2317

原创 多任务学习“Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics”

多任务学习系统的性能很大程度上依赖于任务间的损失权值。手动调节权值非常耗时耗力,论文提出使用任务间的同方差不确定性给每个损失函数赋权。模型由单一图像同时学习像素级深度回归、语义及实例分割。场景理解的多任务学习在机器人领域比较实用,多个任务组合到一个模型可以降低计算量。多任务学习中每个任务的最优权值依赖于调节尺度、任务的噪声幅值。论文多任务学习的结构为: 相关工作 多任务学习可以认为是归纳知识迁移

2017-12-08 14:34:00 13990 8

原创 多任务学习“Rotating Your Face Using Multi-task Deep Neural Network”

多任务学习框架,在保持人脸ID同时将任意姿态和光照人脸旋转到目标姿态,目标姿态可以人为控制。通过使用人造的控制姿态的图像,提取姿态及光照不变的特征,用于人脸识别,在MultiPIE数据库上比较。论文通过训练一个DNN网络,将一幅人脸和一个表示目标姿态的二值编码作为输入,即Remote Code,生成目标姿态且具有相同身份的人脸图像。这个人脸旋转器可以认为是一个黑盒子,旋转器的质量由输出图像与目标姿态

2017-12-06 11:20:46 839 2

原创 多任务学习“Fine-grained Recognition in the Wild: A Multi-Task Domain Adaptation Approach”

精细图像分类需要大量样本标记,但有些样本不容易标记。论文使用容易标记的样本,研究domain adaptation解决易获取样本与自然场景样本数据集转换的问题。这其中多任务的属性学习被用来提升性能。论文要解决的问题示例,先获取有标记的样本,实际应用的场景有少许样本有标记,使用domain adaptation作为两个数据集之间的转换方法: 大部分的类别在某些已知的结构上与其他类别相关,比如,不同的

2017-11-02 16:26:34 2578 1

原创 多任务学习“Exploiting Multi-Grain Ranking Constraints for Precisely Searching Visually-similar Vehicles”

multi-grain ranking约束用于车辆精确检索。其中一个是Generalized Pairwise Ranking(GPR),将二值的相似/不相似关系泛化到广义的多层关系,(0/1)到(0/1/2/3…n)。另外一个是Multi-Grain based List Ranking(MGLR),使用一组具有多层关系的图像训练,ranking对应多次关系,使用组合概率对multi-grain

2017-10-27 17:02:19 1296

原创 多任务学习“Facial Landmark Detection by Deep Multi-task Learning”

使用多任务学习提升人脸特征点检测的准确率,相关的任务如人头姿态估计、人脸属性预测(性别、年龄、人脸表情)。考虑到不同任务的收敛速度不一样,有些任务可以提前停止优化。人类特征点检测的估计受其他任务或相关因素的影响。如人笑的时候嘴是大张的,头部偏转角度大时,瞳孔距离变小,挖掘这些人脸属性相关的信息可以帮助检特征点。示例 如图1所示: 不同的任务学习的难度比较大,如分辨“戴眼镜”就比分辨是否“笑”要简单

2017-10-26 11:40:46 1502

原创 多任务学习“Embedding Label Structures for Fine-Grained Feature Representation”

论文使用多任务学习框架进行精细的车辆分类,同时学习分类和相似度约束。车辆分类可以分为多层,如品牌、型号、年款,为了对多层之间相关性进行建模,使用triplet loss,将标记的结构如hierarchy的或者shared attributes嵌入到框架中。为了获得精细粒度的特征表示,一些方法加入similarity 约束,如contrastive、tiplet损失。直接使用相似度约束在找相同的实例中

2017-10-25 15:20:54 2206 2

原创 行人属性“Weakly-supervised Learning of Mid-level Features for Pedestrian Attribute Recognition and Loca”

不同于多标签学习,这篇论文建立了一个弱监督属性定位框架。基于GoogleNet,设计新的检测层提取mid-level属性特征。不需要bbox属性标记,使用基于最大池化的弱监督目标检测技术训练mid-level层。然后,回归这些检测响应梯度,预测属性标签。最后,对检测层的融合激活图聚类,得到属性的位置和形状。融合的权值由属性及其对应的mid-level特征相关程度估计。在PETA和RAP数据集上实验。

2017-10-20 16:31:58 3521 2

原创 行人属性“Multi-attribute Learning for Pedestrian Attribute Recognition in Surveillance Scenarios”

行人属性预测中被多篇论文引用的论文。内容相对简单,两个网络结构,DeepSAR对每个属性独立预测,DeepMAR多属性联合预测。目前属性预测关注的两个场景:自然场景和监控场景。自然场景图像质量一般比较高,而监控场景图像一般比较模糊、分辨率低、光线变化比较大。属性间一般是相互关联的,如头发的长度可以帮助性别的识别。网络结构: 属性通常不具有同一分布,为解决样本不均问题,提出改进的损失函

2017-10-20 10:52:51 4958 8

原创 行人属性“Attribute Recognition by Joint Recurrent Learning of Context and Correlation”

应该是比较新的属性学习文章了,ICCV2017。在监控场景中进行行人属性的识别,主要遇到的挑战是图像质量差,外形变化及属性可能在不同的空间位置,标记的训练样本少。论文提出JRL模型挖掘属性上下文信息及属性间相互关系提升识别准确率。JRL在一张行人图像内学习属性相关性,具体的说是属性预测顺序的相互关联性。解决属性预测遇到挑战的方法,一是使用属性的相关性:如“女性”和“裙子”在一张行人图像中出现的可能性

2017-10-19 16:30:43 3936 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除