NRZZN-CSDN博客

原创【论文阅读】Generating Videos with Scene Dynamics

【论文阅读】Generating Videos with Scene Dynamics这篇论文属于一篇视频生成的论文，论文将视频的前景和背景进行了解耦，分别使用3D卷积网络生成运动前景和使用2D卷积网络生成静态背景，同时在生成的过程之中使用了含有mask的显性表达式，之后会详细地介绍。正文该文章将运动前景的生成和静态背景的生成解耦了，首先输入为100维的噪声向量，然后使用3D转置卷积网络生成...

2019-08-11 20:00:40 711

原创【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks

【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks这篇文章是基于正交时空编码图的方法，时空编码图使用的是HSV模型，其中色彩信息H用来编码骨骼的时空信息，饱和度S和亮度V用来编码骨骼关节点的运动速度信息，这篇文章的一些想法还是挺有意思的。网络结构整个网络结构如...

2019-07-19 20:52:38 403

原创【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition

【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition这篇论文使用LSTM对人体骨骼的时空特征直接建模，提出了一种级联地组合人体骨骼各个部分运动的方法，虽然我感觉最后的实验表明级联各个部分并没有太大的提升，但是也可能是数据集的原因，总体感觉想法还是好的。网络结构整个网络结构如上图所示...

2019-07-19 20:52:22 958

原创【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks

【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks这篇文章也是属于正交编码图的方法之一，只不过该论文投影的是关节点轨迹，其整个论文形式和累积关节点的论文差不多一致的。网络结构整个网络结构如上图所示，骨骼序列首先生成3张正交编码图，该正交编码图是在3D空间累积关...

2019-07-19 20:52:07 611

原创【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition

【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition这篇论文主要实验了在使用骨骼关节的几何特征创建时空特征图时，各种特征的实验效果，也是挺有意思的。网络结构整个网络结构也很简单，就是选了很多种骨骼关节点几何特征构建时空特征图，然后将这些时空特征图输入到卷积神经网络中，...

2019-07-19 20:51:52 314

原创【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition

【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition这篇论文感觉写的太复杂，并不怎么好，所以只挑重点介绍一下就好。网络结构整个网络结构如上图所示，也是基于时空编码图的方法，时空编码图的构建方法：1.首先确定人体骨骼的4个参考关节点（两肩和两腿上），选这4个关节点的原因是这4个关节点在大多数的运...

2019-07-19 20:51:19 483

原创【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition

【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition之前的构建的时空编码图都是以直接排列关节点的坐标来构建。这种时空编码图虽然能够通过归一化来克服平移不变性（translation）和尺度不变性（scale），但是始终存在一个缺陷：就是它始终对于旋转（rotation）是敏感的。本文为了解决这个问题，不再直接...

2019-07-19 20:50:49 368

原创【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks

【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks这篇文章使用的是成对关节点之间的欧拉距离来构建时空编码图，但是并没有什么理论支撑比之前使用坐标和使用CDNM特征构建的更有优势，但是可以当成一个方法的拓展。实验方法整个实验框架就是，分别构建xy、xz、yz和xyz空间的...

2019-07-19 20:50:30 331

原创【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network

【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network这是基于骨骼的行为识别方法中，使用时空编码图的开山之作，后续还会介绍许多使用时空编码图的方法。正文整个方法的结构很简单，如上图所示，首先将骨骼序列编码为一张时空编码图，然后将时空编码图输入到卷积神经网络中，得到行为类别的识别结果。时空编码图的构...

2019-07-19 20:48:46 1147

原创【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition

【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition个人感觉这篇文章写得挺好的，而且由于太久没有看行为识别相关论文了，所以准备好好地看一下这篇论文，然后基于这篇论文地参考文献往前搜索。3D卷积网络中的运动信息提出问题：3D卷积网络到底能不能提取全部的运动信息呢？这是文章首先提出的第一个问题，我对这个问题也是非常地感兴趣。...

2019-07-19 20:48:08 1015 1

原创【论文阅读】Actions ~ Transformations

Actions ~ Transformations最近看行为识别论文，发现这篇论文一直都没有看过，但是引用也不少，所以抽出一个上午把这篇论文通读了一遍。这篇文章通过变换矩阵学习各种类别的行为的变化，即使用一个线性系统保存一种行为类别的动态变化，感觉想法是挺有意思的，目前我正想着能否将其应用于序列合成的问题。网络结构正如前言所说，文章使用一个线性系统来描述一类行为高层视觉信息的动态变化，为了...

2019-07-19 20:47:43 221

原创【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition

【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition这是一篇2018年cvpr的关于3D卷积神经网络的论文，其实个人感觉还篇论文投2017年的cvpr比较合适。这篇文章还是解决3D卷积神经网络参数量大，在小数据集上不易训练，容易过拟合的问题。解决的思路就是使用3D和2D卷积核交替混合的思想，提出了MiCT...

2019-06-02 19:28:24 920

原创【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition

【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition这篇文章的主要贡献是在 Attention LSTM的基础上引入了 conv-lstm。文章将这种 conv-lstm +attention的结构称为 VideoLSTM。文章中生成 attention map 的方法与 ALSTM也不完全一样，博客中也会介绍一...

2019-05-27 09:39:52 1613

原创 win10安装可以使用sift和surf的opencv-python

在anaconda中安装python-opencv最近发现安装的python-opencv里面没有sift，之前装的时候就没下载包含sift特征的contrib版的，只能把现在的版本卸载，重新安装包含有sift的contrib版了，所以在此记录一下。首先去网站上下载需要的python-opencv安装包（链接地址）。网站打开如下图所示，因为我的是python3.6 所以直接下载对应的版本即...

2019-03-22 10:53:07 1303 2

原创【论文阅读】Action Recognition Using Visual Attention

【论文阅读】Action Recognition Using Visual Attention这是一篇16年的CNN+LSTM形式的论文，它开创性地引入了注意力机制，使得15年之后沉寂许久的CNN+LSTM的网络结构的结果得到了提升，而且本文的探索性实验做的都非常地好，非常值得一读。论文地址：链接地址代码（pytorch）：链接地址正文人的视觉并不会关注场景中的所有物体，而是通常会聚焦场...

2019-01-09 09:16:05 3288 6

原创【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description

【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description这篇文章是15年的一篇文章，文章设计了CNN+LSTM的网络结构用于行为识别、图像描述、视频描述。本文的网络和之前介绍的一篇很像链接地址，区别主要在本文的网络使用的是端到端训练的，所以就非常非常非常简略地介绍一下这个网络，其...

2019-01-08 19:52:30 6833 5

原创【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification

【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification之前3DCNN网络的论文算是记录完了，虽然最近又出了几篇，但是时间有限，很快要去实习去了，剩下的以后有时间再讲吧。本篇论文算是CNN+LSTM网络结构的开山之作，其实对于视频分析和行为识别这个任务目标，我们自然而然地想到的就是CNN+LSTM这种网络结构，简洁优...

2019-01-05 15:18:07 2654 2

原创【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding

【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding这是一篇google的论文，它和之前介绍的一篇facebook的论文的研究内容非常相似链接地址，两篇论文放到ArXiv上只相差了一个月，但是个人感觉还是google的这篇写得好一些。（这篇博客解读的是早期版本的论文，后来新的版本的论文又在Somethin...

2018-12-26 20:16:14 3163 3

原创【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition

【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition

2018-12-24 16:28:27 3845 6

原创【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks虽然这是一篇17年ICCV的论文，但是这篇论文里没有使用kinetics数据集，可能应该是作者做相关实验的时候kinetics数据集还没有发布吧，作者关注当时的3D卷积网络计算效率低、参数量大的问题。所以从减少参数量的角度切入，想到了将 3D...

2018-12-20 14:59:17 3343

原创【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?之前提出的3D卷积网络的深度都很浅，因为当时的数据集都小，很容易过拟合。但是现在有了kinetics，那么这个数据集在训练3D卷积网络时还会过拟合吗？本文经过实验发现，kinetics数据集即使在训练非常深的3DCNN时也不会过拟合。我们知道在...

2018-12-18 20:07:38 4733 4

原创【论文阅读】Long-term Temporal Convolutions for Action Recognition

【论文阅读】Long-term Temporal Convolutions for Action Recognition这篇论文之前，几乎所有的3D卷积网络的输入视频长度都很短，例如C3D、Res3D都只有16帧，那么长时输入视频对最终的结果有没有影响呢？所以本文探索了3D卷积网络输入视频的时长对识别效果的影响，发现输入视频时长越长，效果越好，从而提出了LTC 3D网络结构，同时文章评估了LTC...

2018-12-18 16:12:14 2234 1

原创【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition

【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition这是2017ICCV workshop的一篇文章，这篇文章只是提出了一个3D-ResNets网络，与之前介绍的一篇文章链接地址非常非常相似，在结构上只有一点点不同，既然如此，那么我为什么还要介绍这一篇文章呢，因为本文最大的...

2018-12-12 21:31:29 3124 5

原创【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning

【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning这是一篇和I3D同一时间的论文，论文的作者就是提出C3D网络的那个人，本文也是通过实验探索了更优的3D网络结构，提出了一种Res3D网络模型，该网络比C3D网络的FLOPs小两倍，比C3D网络的参数量小2倍，同时模型的性能也要好于C3D。论文地址：下载链接...

2018-12-12 10:47:29 3048 4

原创【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset这是一篇2017CVPR的论文，我感觉这篇论文最大的贡献就是提出了kinetics数据集，这个数据集与之前的行为识别数据集相比有质的飞跃。同时文章也提出一种将2D卷积网络扩张成3D卷积网络的思想，使3D卷积网络可以收益于2D卷积网络的发展。感觉以后行为...

2018-12-10 17:05:28 9707 1

原创【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks

【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks这是一篇15年ICCV的论文，在15年的时候，3D卷积网络刚刚兴起，但是因为3D卷积网络的参数量较多，而且训练数据的规模也没有现在这么大，所以网络的参数非常不易优化，这个时候，限制3D卷积网络性能的主要是数据。文章根据当时3D...

2018-12-09 10:55:13 3368 1

原创【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks

【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks这是一篇15年ICCV的论文，本篇论文提出的C3D卷积网络是3D卷积网络的里程碑，以3D卷积核为基础的3D卷积网络从此发展起来。论文地址：下载地址基于pytorch的c3d模型代码：下载地址简介文章认为一个有效的视频描述子应该具备以下特点：良好的泛...

2018-12-07 12:05:48 11962 11

原创 win10+Anaconda5.0.1 python3.6 编译caffe的坑

执行官网给的第四步程序的时候C:\Projects\caffe> scripts\build_win.cmd它会自动检测你电脑的python版本，然后去下面网址下载依赖包https://github.com/willyd/caffe-builder/releases但是截止到2017.11.23之前，只有python3.5或者python2.7的依赖包，没有对应pyt

2017-11-23 09:10:19 1504

原创浏览器主页被更改成7654主页

前段时间使用U大师PE装了win10系统，系统装完发现ie和下载的chrome主页都被篡改成了7654主页。打开浏览器会自动转到u.xiaoxiangbz.com，然后跳转到7654。在chrome中设置主页和重置设置都不起作用。然后在网上搜索了半天，然后看到https://www.zhihu.com/question/54187929 中有人说是U大师的问题。需要删除

2017-03-23 16:56:50 7742

zzmshuai的博客