背包_十年-CSDN博客

原创 [行为检测|论文解读]行为检测调研综述

计算机视觉行为检测视频理解1. 背景2. 国内外研究现状3. 行为分类3.1 研究难点3.2 数据集介绍3.3 传统方法3.3.1 密集采样特征点3.3.2 轨迹与轨迹描述子3.3.3 运动描述子3.4 TWO STREAM方法3.4.1 TWO-STREAM CNN3.4.2 TSN3.5 C3D方法3.6 RNN方法3.6.1 网络结构3....

2018-03-09 23:05:54 24822 6

原创 [机器学习一]之贝叶斯系列

第1章贝叶斯定理1.1 基本概念1.2 全概率公式1.3 贝叶斯公式1.4 参考文献第2章贝叶斯决策理论2.1 贝叶斯决策理论2.2 贝叶斯分类规则2.2.1 决策错误概率(probability of decision error)2.2.2 平均风险最小(minimizing the average risk)第3章决策函数与决策面3.1 决策面...

2018-02-14 11:21:41 2121

原创用tf.data.dataset构建input pipline

用dataset构建input pipline这一部分主要参考tensorflow的官方教程：tf.data.datasets, 上一篇tensorflow数据读取是基于多线程数据抓取的方式，维护多队列（文件队列，example队列），是比较偏底层的。可能现在tensorflow开始慢慢走了上封装之路，datasets的出现隐藏了底层的实现。（还好不像python~~~~~~~~匿了）。因为本人是做

2018-03-17 12:06:03 7420 4

原创 [行为识别] 2018 AAAI 行为识别论文解读

[行为识别] 2018 AAAI 行为识别论文解读Action Detection[1] ++Action Recognition from Skeleton Data via Analogical Generalization over Qualitative Rep

2018-03-08 20:15:45 15945 1

原创 [聚类一]之距离计算

距离计算我们通常采用计算“距离”的方法来度量不同样本之间的相似性，进而判断该样本的大致类别。距离首先是一个几何概念，用dist(⋅,⋅)dist(⋅,⋅)\mathrm{dist}(\cdot,\cdot)表示，其中最为任熟悉的是二维和三维几何空间的欧几里德距离，随着数据维度的增大，距离在维数、幂次数等方面被推广了，距离被抽象为满足一些基本性质：非负性：dist(xi,xj)≥0;(...

2018-03-05 22:18:12 7020 3

转载 conda-多环境配置

anaconda 能带你去任何地方，今天带大家一起窥一窥conda的多环境配置。1. anaconda概述Anaconda是一个用于科学计算的Python发行版，支持 Linux, Mac, Windows系统，提供了包管理与环境管理的功能，可以很方便地解决多版本python并存、切换以及各种第三方包安装问题。Anaconda利用工具/命令conda来进行package和environme...

2018-03-05 22:16:29 15497

原创 [贝叶斯九]之EM算法

一、简单介绍EM(Expectaion Maximization)算法(又称为期望最大化方法)是一种迭代算法，Dempster等人在1977年总结提出来的。简单来说EM算法就是一种含有隐变量的概率模型参数的极大似然估计。EM算法的每次迭代由两步组成：第一是求期望，第二是求极大。EM算法在机器学习中有极为广泛的应用。如常被用来学习高斯混合模型(Gaussian mixture model, 简称...

2018-02-27 17:12:15 1166

原创 [贝叶斯八]之极大似然估计

一、简单介绍极大似然估计是根据观察数据来估计模型参数的方法，即“模型已定，模型未知”。它是参数估计的一种方法，请参考《概率论与数理统计(浙大第四版)》中参数估计。举个例子，大家都知道抛硬币的实验：假设有一枚不规则的硬币，要计算它正面朝上的概率。其实就是估计一个二分布的参数。现在我们开始做实验，抛了10次，得到相应的结果。那么如何根据这些结果来估计我们的参数呢？这就是极大似然估计要处理...

2018-02-08 22:01:30 264

原创 [贝叶斯七]之正态分布贝叶斯决策

贝叶斯是非常传统，理论简单，但是非常有效的一种机器学习方法。经过大量实验表明，贝叶斯方法是极具鲁棒性的。至今为止仍然有很多人在研究贝叶斯的基础理论，而且发现许多算法都可以由贝叶斯推导而来，所以贝叶斯是具有极大的研究价值的理论。这一章节我们就来扯一扯正态分布数据的贝叶斯决策理论，看看我们能搞点什么事情出来。自己多多推导，没准能发现新的大陆。许多优秀的算法，比如SVM等等往往就是这样诞生的。...

2018-02-08 21:55:18 10063 1

原创 [贝叶斯六]之朴素贝叶斯分类器设计

同样，类似于[贝叶斯四]之贝叶斯分类器设计，我们用一个例子：字母分类，来阐述朴素贝叶斯分类器的设计。老套路，搞个三部曲：特征向量生成决策函数设计模型训练在做问题分析之前，请先做数据集的分析。一、数据集分析数据集来自于UCI： UCI字母分类数据集链接这个数据集原始数据一共包含20000张图像(一般取前16000张图像作为训练，后4000张图像作为测试)，每张图像经过...

2018-02-07 21:50:05 992

原创 [贝叶斯五]之朴素贝叶斯

一、前因这一章节依然是基础知识，贝叶斯分类器的核心就是要计算出后验概率p(wi|x)p(wi|x)p(w_i|x)，依据贝叶斯定理 p(wi|x)=p(x|wi)p(wi)p(x)p(wi|x)=p(x|wi)p(wi)p(x)p(w_i|x) = \frac {p(x|w_i)p(w_i)}{p(x)}其中： p(wi)p(wi)p(w_i)是类别iii出现的概率，这个比较好求...

2018-02-07 16:56:19 293

原创 [贝叶斯三]之决策函数和决策面

一、决策面(Decision Surfaces)1.1 概念如果输入的数据是一个LLL维空间特征，考虑一个MMM分类问题，那么分类器将会把这个LLL维空间的特征点分为MMM个区域。每个区域显然就属于一个类别，如果输入一个点xxx落在第iii个区域，那么xxx就属于第iii类。分割成这些区域的边界就称为决策面。1.2 例子下面是一个简答的例子：输入是一维，决策函数是p...

2018-02-07 15:08:05 9191

原创 [贝叶斯一]之贝叶斯理论

一、基本概念贝叶斯理论是机器学习中一个核心方法，它由英国数学家托马斯贝叶斯在1763年发表的一篇论文中首先提出这个定理。贝叶斯定理是用来度量不确定性事件的，比如今天下雨概率，是一种概率模型。在介绍贝叶斯理论之前我们先看看统计模式识别（statistical pattern recognition）中的一些概率知识。假设有一组随机数据X=[x1,x2,x3,......xl]T∈RlX=[x...

2018-02-07 10:43:02 1065

原创 [贝叶斯四]之贝叶斯分类器设计

这一小节我们将简单的阐述一般贝叶斯分类器设计的方法。分类器流程如下所示。输入：d-dim 特征向量计算决策函数值(针对每个类别)选取最大的值做出决策输出结果如下图可以清楚的表达整个分类器工作的流程。借用《算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification)》的一张图来表示整个设计的流程。下面我们将以两个小例子来贯穿...

2018-02-06 22:12:12 2096

原创 [贝叶斯二]之贝叶斯决策

生活中的许多决策都是不确定性的，比如明天是否下雨，我需要带伞么？这个时候就需要我们做出决策，如果认为明天会下雨，显然我们就会带上伞，否则不然。那么这个时候我们怎么判断我们的决策是否可信？又是否是最佳的决策呢？这个时候往往就需要引入评价准则(evaluation criteria)。不同的评价准则在相同的决策机制中往往会导致不同的决策结果。贝叶斯决策常用的评价准则一般如下。最小错误概率(T...

2018-02-04 22:05:27 877

原创 [目标检测|SSD实践一]caffe-ssd基线

本次实验利用caffe-ssd跑出了基线，主要从以下几个方向总结。 - caffe-ssd的编译 - caffe-ssd demo演示 - 自建数据集的数据准备 - fineTuning - 测试分析一、caffe基线实验源码地址在github：https://github.com/weiliu89/caffe/tree/ssd1.1 CPU版安装/...

2018-02-04 19:48:23 1854

原创 [行为检测]R-C3D-Resgion Convolutional 3D Network for Temporal Activity Detection

这篇文章是ICCV 2017的一篇文章，作者主要是以C3D网络为基础。借鉴了Faster RCNN的思路，对于任意的输入视频L，先进行proposal，然后3D-pooling,最后后进行分类和回归操作。文章主要贡献点有3个：可以针对任意长度视频、任意长度行为进行端到端的检测速度很快(是目前网络的5倍)，通过共享Progposal generation 和Classification网络的...

2018-01-26 22:27:21 10068 6

原创 [行为识别]RPAN：An end-to-end recurrent pose-attention network for action recognition

这篇文章是来自中科院深圳先进院乔宇老师，ICCV2017年的oral文章《RPAN：An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos》。这篇文章的出发点是当前行为识别的一大流行方向：RNN。与之前的video-level category 训练RNN不相同。这篇文章提出了引入pose-at...

2018-01-25 17:42:22 3820 2

原创 [干货|实践] Tensorflow学习 - 使用flags定义命令行参数

学习目的：深度学习神经网络往往有过多的Hyperparameter需要调优，优化算法、学习率、卷积核尺寸等很多参数都需要不断调整，使用命令行参数是非常方便的。有两种实现方式，一是利用python的argparse包，二是调用tensorflow自带的app.flags实现。利用tf.app.flags组件tf定义了tf.app.flags，用于接受命令行传递参数，相当于接受argv。首先调...

2018-01-23 20:25:44 1437

原创 [行为检测] CDC-Convolutional-De-Convolutional Networks for Precise Temporal Action Location

这篇文章是2017年ICCV的一篇文章《Convolutional-De-Convolutional Networks for Precise Temporal Action Localization in Untrimmed Videos》，下面是这篇文章的主要贡献点。第一次将卷积、反卷积操作应用到行为检测领域，文章同时在空间下采样，在时间域上上采样。利用CDC网络结果可以做到端到端的学...

2018-01-23 20:20:37 2642 1

原创 [干货|实践] Tensorflow可视化

TensorBoard简介：TensorBoard是tensorflow官方推出的可视化工具，它可以将模型训练过程中的各种汇总数据展示出来，包括标量(Scalars)、图片(Images)、音频(Audio)、计算图(Graphs)、数据分布(Distributions)、直方图(Histograms)和潜入向量(Embeddigngs)。作用：tensorflow代码执行过程是先构建图，...

2018-01-22 15:08:03 1453

原创 [目标检测] RON-Reverse Connection with Objectness Prior Networks for Object Detection

当前最好的基于深度网络的目标检测框架可以分为两个主要方法流派：基于区域的方法（region-based）和不基于区域（region-free）的方法。两种方法各有优势和劣势。由清华大学计算机系智能技术与系统国家重点实验室、清华国家信息实验室、清华大学计算机科学与技术系、英特尔中国研究院、清华大学电子工程系的研究人员共同参与的关于高效视觉目标检测的研究已经被 CVPR 2017 接收。论文题...

2018-01-20 16:11:32 2161

原创 [行为识别] Two –Stream CNN for Action Recognition in Videos

这篇文章发表于2014 NIPS。也是牛津大学产出的。在这篇文章出来之前其实也有人尝试用深度学习来处理行为识别，例如李飞飞团队【Large-scale video classification with】通过叠加视频多帧输入到网络中进行学习，但是不幸的是这种方法比手动提取特征更加糟糕。当这篇文章出来以后才意味着深度学习在行为识别中迈出了重大的一步。一、前言这里主要阐述了论文的三个主要贡献点...

2018-01-17 19:15:32 5736 5

原创 [目标检测]SSD：Single Shot MultiBox Detector

基于”Proposal + Classification”的Object Detection的方法，RCNN系列(R-CNN、SPPnet、Fast R-CNN以及Faster R-CNN)取得了非常好的效果，因为这一类方法先预先回归一次边框，然后再进行骨干网络训练，所以精度要高，这类方法被称为two stage的方法。但也正是由于此，这类方法在速度方面还有待改进。由此，YOLO[8]应运而生，Y...

2018-01-14 17:09:15 13942 2

原创 [深度学习基础] 初见dropout

1. 初见dropoutDropout是2012年深度学习视觉领域的开山之作paper：《ImageNet Classification with Deep Convolutional》所提到的算法，用于防止过拟合。基本思想： dropout是指在深度学习网络训练的过程中，对于神经网络单元，按照一定的概率将其==暂时==从网络中丢弃，对于随机梯度下降算法来说，由于是随机丢弃，所以每...

2018-01-13 20:53:08 563

原创 [论文解读]VGGNet：Very Deep Convolution Networks for Large-Scale Image Recognition

1. 前言VGG是牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司研究员一起研发的深度卷积神经网络。VGGNet 探索了卷积神经网络的深度与其性能之间的关系，通过反复堆叠3x3的小型卷积核和2x2的最大池化层，VGGNet 成功地构筑了16~19层深的卷积神经网络。VGGNet 相比之前 state-of-the-art 的网络结构，错...

2018-01-12 11:53:19 703

原创基于opencv的鱼眼矫正法-棋盘标定

https://faiculty.com/>这篇文章主要谈论了基于opencv的棋盘标定法的鱼眼矫正步骤。这篇文章主要参考博客：棋盘标定。感谢博主。主要矫正函数：opencv:fisheye序言棋盘标定法需要预先求得内参矩阵和畸变矩阵，之后同一摄像头拍摄的鱼眼图像就可以直接根据他们之间的变换关系确定。具体的有关理论可以移步到：一、程序环境ope

2016-12-04 15:34:25 9384

原创 openCV2.4.8 + VS2013

这篇博客主要记录一下装好openCV和VS2013后如何建立一个基于openCV的项目。一、新建项目新建一个空项目。如下图：二、添加库2.1 VC++ Directoriese在项目 -> 项目属性里2.2 General在项目 -> 项目属性 -> 链接器（Linker）-> 常规（General）2.3 input在项目 -> 项目属性 -> 链接器（Linker）-> 输入（input）添

2016-11-17 22:02:30 548

转载基于CNN的性别、年龄识别

原文地址：http://blog.csdn.NET/hjimce/article/details/49255013**作者：**hjimce一、相关理论　　本篇博文主要讲解2015年一篇paper《Age and Gender Classification using Convolutional Neural Networks》，个人感觉这篇文献没啥难度，只要懂得Alexnet，实现这篇文献的算法，

2016-11-02 11:09:13 2701

转载 caffe了解

原文地址：http://blog.csdn.net/hjimce/article/details/48933813**作者：**hjimce本文主要讲解caffe的整个使用流程，适用于初级入门caffe，通过学习本篇博文，理清项目训练、测试流程。初级教程，高手请绕道。我们知道，在caffe编译完后，在caffe目录下会生成一个build目录，在build目录下有个tools，这个里面有个可执行文件c

2016-11-01 22:03:55 981

转载卷积神经网络

原文地址：http://blog.csdn.NET/hjimce/article/details/47323463作者：hjimce卷积神经网络算法是n年前就有的算法，只是近年来因为深度学习相关算法为多层网络的训练提供了新方法，然后现在电脑的计算能力已非当年的那种计算水平，同时现在的训练数据很多，于是神经网络的相关算法又重新火了起来，因此卷积神经网络就又活了起来。在开始前，我们需要明确的是网上讲的卷

2016-10-31 16:18:16 1134

原创 [调研报告]人脸识别

一、前述1. 发展以往的人脸识别主要是包括人脸图像采集、人脸识别预处理、身份确认、身份查找等技术和系统。现在人脸识别已经慢慢延伸到了ADAS中的驾驶员检测、行人跟踪、甚至到了动态物体的跟踪。由此可以看出，人脸识别系统已经由简单的图像处理发展到了视频实时处理。而且算法已经由以前的Adaboots、PCA等传统的统计学方法转变为CNN、RCNN等深度学习及其变形的方法。现在也有相当一部分人...

2016-10-31 15:55:37 25526 6

原创 htk安装

可以参考链接：htk安装如果有问题可以与我联系，，本人正在学习之中，，可以多多交流。一. 需要软件包g++-multilib gcc-mulitlib libc6-dev libc6-dev:i386 libx11-dev:i386二. 安装1. /usr/include/features.h:374:25: fatal error: sys/cdefs.h: No such file

2016-10-09 11:36:59 656

原创 ubuntu问题集锦

一. ubuntu更新出错1.更新后连接出错100% [Connecting to security.ubuntu.com (2001:67c:1562::15)] [Connecting to archive.canonical.com (2001:67c:1360:8c01::16)]解决方法：Open /etc/gai.confUncomment the following line:##

2016-10-08 21:53:33 3879

原创编译器

https://faiculty.com/>编译器构造一、设计文法::= ::="{""}" /*blockstatement*/ |[] ["="]";" /*assignment*/ |"return"";" |"if""("")"["else"]

2016-09-17 21:53:38 1355 1

原创数据库

面试中常问的十个问题参考自：http://blog.sina.com.cn/s/blog_8dc50331010158u7.html 触发器的作用？答：触发器是一种特殊的存储过程，主要是通过事件来触发而被执行的。它可以强化约束，来维护数据的完整性和一致性，可以跟踪数据库内的操作从而不允许未经许可的更新和变化。可以联级运算。如，某表上的触发器上包含对另一个表的数据操作，而该操作又会导致该表触发

2016-09-13 09:35:35 409

转载车牌识别

本篇文章参考于网页开发链接。我目前在学习过程中，谢谢该开源者的分享。gitHub链接。一、车牌检测1. 车牌定位这一部分的输入是原始图片，输出为可能的车牌矩形框。即将图片进行预处理，分割图片，找到可能是车牌的矩形框。作为后面SVM训练输入，定位车牌。高斯模糊顾名思义，其一般应用是将图像变得模糊，但同时高斯模糊也应用在图像的预处理阶段。理解高斯模糊前，先看一下平均模糊算法。平均模糊的算法非常简单。每一

2016-09-12 19:23:26 3594

原创文本分类

文本分类分类过程把所有文本分为训练样本和测试样本训练样本：样本分词：把样本用分词工具全部进行分词去停用词：去掉一些无用的词语，如那、这些、明天等等提取初步特征计算特征互信息按照互信息的大小排序，获得本次实验特征值训练分类器（SVM）测试样本测试集分词处理去停用词计算样本的特征向量这里不再按照分类进行介绍，直接按照训练样本的所需步骤逐个详细介绍，然后介绍如何做测试，然后谈

2016-09-12 14:20:18 829

原创计算机网络

计算机网络体系结构计算机网络组成一个完整的计算机网络主要由硬件、软件、协议。硬件：计算机主机，端系统、通信链路、交换设备（路由器、交换机）和通信处理机（如网卡）软件：实现资源共享的各种软件，操作系统、邮件收发程序、聊天程序等等协议：规定了网络传输数据时所遵循的规范计算机网络功能数据通信资源共享分布式处理提高可靠性负载均衡计算机网络分类按分

2016-09-12 09:46:03 1538

原创图论

图论图的连通性生成树最小生成树prime算法把所有的点分成两类，一类是已到达的，一类是未到达的。初始化，源点为已到达点，其它均为不可到达点。然后从已到达点堆到不可到达点堆的所有边中挑出代价最小的一条边加入生成树中，再将连接的这个点加入已到达点堆，依次迭代，直到所有点都可到达。时间复杂度:O(n^2)kruskal算法把所有边排序，依次取最小的边，如果不构成环则把它加入生成树中。（利用并查集

2016-09-10 22:01:26 506

空空如也

markdown编辑时，如何使每段文字开头空两格啊。。求高手指导