自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 【论文阅读】Generating Videos with Scene Dynamics

【论文阅读】Generating Videos with Scene Dynamics这篇论文属于一篇视频生成的论文,论文将视频的前景和背景进行了解耦,分别使用3D卷积网络生成运动前景和使用2D卷积网络生成静态背景,同时在生成的过程之中使用了含有mask的显性表达式,之后会详细地介绍。正文该文章将运动前景的生成和静态背景的生成解耦了,首先输入为100维的噪声向量,然后使用3D转置卷积网络生成...

2019-08-11 20:00:40 711

原创 【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks

【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks这篇文章是基于正交时空编码图的方法,时空编码图使用的是HSV模型,其中色彩信息H用来编码骨骼的时空信息,饱和度S和亮度V用来编码骨骼关节点的运动速度信息,这篇文章的一些想法还是挺有意思的。网络结构整个网络结构如...

2019-07-19 20:52:38 403

原创 【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition

【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition这篇论文使用LSTM对人体骨骼的时空特征直接建模,提出了一种级联地组合人体骨骼各个部分运动的方法,虽然我感觉最后的实验表明级联各个部分并没有太大的提升,但是也可能是数据集的原因,总体感觉想法还是好的。网络结构整个网络结构如上图所示...

2019-07-19 20:52:22 958

原创 【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks

【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks这篇文章也是属于正交编码图的方法之一,只不过该论文投影的是关节点轨迹,其整个论文形式和累积关节点的论文差不多一致的。网络结构整个网络结构如上图所示,骨骼序列首先生成3张正交编码图,该正交编码图是在3D空间累积关...

2019-07-19 20:52:07 611

原创 【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition

【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition这篇论文主要实验了 在使用 骨骼关节的几何特征创建时空特征图时,各种特征的实验效果,也是挺有意思的。网络结构整个网络结构也很简单,就是选了很多种骨骼关节点几何特征构建时空特征图,然后将这些时空特征图输入到卷积神经网络中,...

2019-07-19 20:51:52 314

原创 【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition

【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition这篇论文感觉写的太复杂,并不怎么好,所以只挑重点介绍一下就好。网络结构整个网络结构如上图所示,也是基于时空编码图的方法,时空编码图的构建方法:1.首先确定人体骨骼的4个参考关节点(两肩和两腿上),选这4个关节点的原因是这4个关节点在大多数的运...

2019-07-19 20:51:19 483

原创 【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition

【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition之前的构建的时空编码图都是以直接排列关节点的坐标来构建。这种时空编码图虽然能够通过归一化来克服平移不变性(translation)和尺度不变性(scale),但是始终存在一个缺陷:就是它始终对于旋转(rotation)是敏感的。本文为了解决这个问题,不再直接...

2019-07-19 20:50:49 368

原创 【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks

【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks这篇文章使用的是 成对关节点之间的欧拉距离来构建时空编码图,但是并没有什么理论支撑比之前使用坐标和使用CDNM特征构建的更有优势,但是可以当成一个方法的拓展。实验方法整个实验框架就是,分别构建xy、xz、yz和xyz空间的...

2019-07-19 20:50:30 331

原创 【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network

【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network这是基于骨骼的行为识别方法中,使用时空编码图的开山之作,后续还会介绍许多使用时空编码图的方法。正文整个方法的结构很简单,如上图所示,首先将骨骼序列编码为一张时空编码图,然后将时空编码图输入到卷积神经网络中,得到行为类别的识别结果。时空编码图的构...

2019-07-19 20:48:46 1147

原创 【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition

【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition个人感觉这篇文章写得挺好的,而且由于太久没有看行为识别相关论文了,所以准备好好地看一下这篇论文,然后基于这篇论文地参考文献往前搜索。3D卷积网络中的运动信息提出问题:3D卷积网络到底能不能提取全部的运动信息呢?这是文章首先提出的第一个问题,我对这个问题也是非常地感兴趣。...

2019-07-19 20:48:08 1015 1

原创 【论文阅读】Actions ~ Transformations

Actions ~ Transformations最近看行为识别论文,发现这篇论文一直都没有看过,但是引用也不少,所以抽出一个上午把这篇论文通读了一遍。这篇文章通过变换矩阵学习各种类别的行为的变化,即使用一个线性系统保存一种行为类别的动态变化,感觉想法是挺有意思的,目前我正想着能否将其应用于序列合成的问题。网络结构正如前言所说,文章使用一个线性系统来描述一类行为高层视觉信息的动态变化,为了...

2019-07-19 20:47:43 221

原创 【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition

【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition这是一篇2018年cvpr的关于3D卷积神经网络的论文,其实个人感觉还篇论文投2017年的cvpr比较合适。这篇文章还是解决3D卷积神经网络参数量大,在小数据集上不易训练,容易过拟合的问题。解决的思路就是使用3D和2D卷积核交替混合的思想,提出了MiCT...

2019-06-02 19:28:24 920

原创 【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition

【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition这篇文章的主要贡献是在 Attention LSTM的基础上引入了 conv-lstm。文章将这种 conv-lstm +attention的结构称为 VideoLSTM。文章中生成 attention map 的方法 与 ALSTM也不完全一样,博客中也会介绍一...

2019-05-27 09:39:52 1613

原创 win10安装可以使用sift和surf的opencv-python

在anaconda中安装python-opencv最近发现安装的python-opencv里面没有sift,之前装的时候就没下载包含sift特征的contrib版的,只能把现在的版本卸载,重新安装包含有sift的contrib版了,所以在此记录一下。首先去网站上下载需要的python-opencv安装包(链接地址)。网站打开如下图所示,因为我的是python3.6 所以直接下载对应的版本即...

2019-03-22 10:53:07 1303 2

原创 【论文阅读】Action Recognition Using Visual Attention

【论文阅读】Action Recognition Using Visual Attention这是一篇16年的CNN+LSTM形式的论文,它开创性地引入了注意力机制,使得15年之后沉寂许久的CNN+LSTM的网络结构的结果得到了提升,而且本文的探索性实验做的都非常地好,非常值得一读。论文地址:链接地址代码(pytorch):链接地址正文人的视觉并不会关注场景中的所有物体,而是通常会聚焦场...

2019-01-09 09:16:05 3288 6

原创 【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description

【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description这篇文章是15年的一篇文章,文章设计了CNN+LSTM的网络结构用于行为识别、图像描述、视频描述。本文的网络和之前介绍的一篇很像链接地址,区别主要在本文的网络使用的是端到端训练的,所以就非常非常非常简略地介绍一下这个网络,其...

2019-01-08 19:52:30 6833 5

原创 【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification

【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification之前3DCNN网络的论文算是记录完了,虽然最近又出了几篇,但是时间有限,很快要去实习去了,剩下的以后有时间再讲吧。本篇论文算是CNN+LSTM网络结构的开山之作,其实对于视频分析和行为识别这个任务目标,我们自然而然地想到的就是CNN+LSTM这种网络结构,简洁优...

2019-01-05 15:18:07 2654 2

原创 【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding

【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding这是一篇google的论文,它和之前介绍的一篇facebook的论文的研究内容非常相似链接地址,两篇论文放到ArXiv上只相差了一个月,但是个人感觉还是google的这篇写得好一些。(这篇博客解读的是早期版本的论文,后来新的版本的论文又在Somethin...

2018-12-26 20:16:14 3163 3

原创 【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition

【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition

2018-12-24 16:28:27 3845 6

原创 【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks虽然这是一篇17年ICCV的论文,但是这篇论文里没有使用kinetics数据集,可能应该是作者做相关实验的时候kinetics数据集还没有发布吧,作者关注当时的3D卷积网络计算效率低、参数量大的问题。所以从减少参数量的角度切入,想到了将 3D...

2018-12-20 14:59:17 3343

原创 【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?之前提出的3D卷积网络的深度都很浅,因为当时的数据集都小,很容易过拟合。但是现在有了kinetics,那么这个数据集在训练3D卷积网络时还会过拟合吗?本文经过实验发现,kinetics数据集即使在训练非常深的3DCNN时也不会过拟合。我们知道在...

2018-12-18 20:07:38 4733 4

原创 【论文阅读】Long-term Temporal Convolutions for Action Recognition

【论文阅读】Long-term Temporal Convolutions for Action Recognition这篇论文之前,几乎所有的3D卷积网络的输入视频长度都很短,例如C3D、Res3D都只有16帧,那么长时输入视频对最终的结果有没有影响呢?所以本文探索了3D卷积网络输入视频的时长对识别效果的影响,发现输入视频时长越长,效果越好,从而提出了LTC 3D网络结构,同时文章评估了LTC...

2018-12-18 16:12:14 2234 1

原创 【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition

【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition这是2017ICCV workshop的一篇文章,这篇文章只是提出了一个3D-ResNets网络,与之前介绍的一篇文章链接地址非常非常相似,在结构上只有一点点不同,既然如此,那么我为什么还要介绍这一篇文章呢,因为本文最大的...

2018-12-12 21:31:29 3124 5

原创 【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning

【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning这是一篇和I3D同一时间的论文,论文的作者就是提出C3D网络的那个人,本文也是通过实验探索了更优的3D网络结构,提出了一种Res3D网络模型,该网络比C3D网络的FLOPs小两倍,比C3D网络的参数量小2倍,同时模型的性能也要好于C3D。论文地址:下载链接...

2018-12-12 10:47:29 3048 4

原创 【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset这是一篇2017CVPR的论文,我感觉这篇论文最大的贡献就是提出了kinetics数据集,这个数据集与之前的行为识别数据集相比有质的飞跃。同时文章也提出一种将2D卷积网络扩张成3D卷积网络的思想,使3D卷积网络可以收益于2D卷积网络的发展。感觉以后行为...

2018-12-10 17:05:28 9707 1

原创 【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks

【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks这是一篇15年ICCV的论文,在15年的时候,3D卷积网络刚刚兴起,但是因为3D卷积网络的参数量较多,而且训练数据的规模也没有现在这么大,所以网络的参数非常不易优化,这个时候,限制3D卷积网络性能的主要是数据。文章根据当时3D...

2018-12-09 10:55:13 3368 1

原创 【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks

【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks这是一篇15年ICCV的论文,本篇论文提出的C3D卷积网络是3D卷积网络的里程碑,以3D卷积核为基础的3D卷积网络从此发展起来。论文地址:下载地址基于pytorch的c3d模型代码:下载地址简介文章认为一个有效的视频描述子应该具备以下特点:良好的泛...

2018-12-07 12:05:48 11962 11

原创 win10+Anaconda5.0.1 python3.6 编译caffe的坑

执行官网给的第四步程序的时候C:\Projects\caffe> scripts\build_win.cmd它会自动检测你电脑的python版本,然后去下面网址下载依赖包https://github.com/willyd/caffe-builder/releases但是 截止到2017.11.23之前,只有python3.5或者python2.7的依赖包,没有对应pyt

2017-11-23 09:10:19 1504

原创 浏览器主页被更改成7654主页

前段时间使用U大师PE装了win10系统,系统装完发现ie和下载的chrome主页都被篡改成了7654主页。打开浏览器会自动转到u.xiaoxiangbz.com,然后跳转到7654。在chrome中设置主页和重置设置都不起作用。然后在网上搜索了半天,然后看到https://www.zhihu.com/question/54187929 中有人说是U大师的问题。需要删除

2017-03-23 16:56:50 7742

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除