自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

DavidZh

起个孬名好养活

  • 博客(37)
  • 收藏
  • 关注

原创 [leetcode93] 93. 复原IP地址(C++)

暴力解法,遍历所有的结果,对所有的结果中进行判断,得到满足条件的ip地址。不要在中间进行判断,条件太多,容易弄乱class Solution {public: vector<string> restoreIpAddresses(string s) { vector<string> res; for(int i=...

2019-09-15 16:38:15 494

原创 [leetcode417]. 太平洋大西洋水流问题

回溯法:方法:从太平洋和大西洋分别往中间进行搜索(下一个节点的满足条件是比该节点的值大),使用两个数组分别记录每一个点是否可以流向的大西洋和是否可以流向太平洋,最后在对两个数组进行遍历,找到既能够去大西洋也能去太平洋的点。class Solution {public: vector<vector<int>> pacificAtlantic(vector<...

2019-08-23 10:56:40 301

原创 基于内容的图像检索(4):评价指标mAP的python实现(搬砖)

最近看了一些有关于图像实例检索的论文,文中使用mAP作为模型的评价指标,关于图像检索中的mAP的原理请看这里。http://yongyuan.name/blog/evaluation-of-information-retrieval.html研究了一下 论文中mAP的计算方式,论文中的mAP的计算文件在这里:https://github.com/filipradenovic/cnnim...

2019-03-23 21:10:15 4235

原创 基于内容的图像检索技术(3):部分论文阅读总结

[1] Ng Y H , Yang F , Davis L S . Exploiting Local Features from Deep Networks for Image Retrieval[J]. 2015.传统的VLAD算法从sift特征中进行计算,这篇文章从卷积网络中进行提取特征,然后使用vlad方法。除此之外,文章有两个贡献 (1)从不同层中提取卷积特征,并采用VLAD将特征编码为...

2019-01-31 19:21:18 2001

原创 基于内容的图像检索(2):算法流程以及典型方法及相关资料

一、图像检索方法流程流程 :构建特征库,构建索引,图像检索构建索引的一个例子是,倒排索引,所谓倒排索引:就是利用稀疏的特征值代替文件编号作为索引值,可以提高检索的效率)核心方法:特征提取,近邻查找特征提取:全局特征、局部特征全局特征与局部特征需要不同的检索方法,如果是全局特征可以直接通过欧式距离进行相似性比较,局部特征一般包含:特征点和特征描述符,则需要对局部的特征点进行匹配,匹配过程...

2019-01-31 10:20:44 2824

转载 基于内容的图像检索技术(1):从特征到检索

作者:赵丽丽链接:https://zhuanlan.zhihu.com/p/46735159来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。基于内容的图像检索(CBIR, Content Based Image Retrieval)是相对成熟的技术领域,在工业界也有广泛的应用场景,如搜索引擎(Google、百度)的以图搜图功能,各电商网站(淘宝、Amazo...

2019-01-30 20:42:56 17608

原创 实验室GPU服务器的配置参考文件

近期,实验室购买了新的服务器,从组装服务器到最后系统安装完成,参考了不少文件,列表如下:一、安装系统uubuntu server 18.04与ubuntu系统安装方式一样,制作启动盘,安装,为了方便后面扩展磁盘,在磁盘安装选择的时候,选择LVM方式。二、新建和彻底删除一个账户授予管理者权限参考:https://www.cnblogs.com/Jokeyyu/p/7261409.html参...

2018-12-25 09:47:27 1583

原创 Pytorch(1) pytorch中的BN层的注意事项

最近修改一个代码的时候,当使用网络进行推理的时候,发现每次更改测试集的batch size大小竟然会导致推理结果不同,甚至产生错误结果,后来发现在网络中定义了BN层,BN层在训练过程中,会将一个Batch的中的数据转变成正太分布,在推理过程中使用训练过程中的参数对数据进行处理,然而网络并不知道你是在训练还是测试阶段,因此,需要手动的加上,需要在测试和训练阶段使用如下函数。model.train(...

2018-11-22 21:44:03 10805

原创 Pytorch(0)降低学习率torch.optim.lr_scheduler.ReduceLROnPlateau类

当网络的评价指标不在提升的时候,可以通过降低网络的学习率来提高网络性能。所使用的类class torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10, verbose=False, threshold=0.0001, threshold_mode='rel', coold...

2018-11-21 08:36:36 42914 7

原创 记录sk-video的安装以及报错处理

遇到一个项目的代码是使用sk-video读取视频数据,在使用pip install sk-video命令完成安装之后,却发现无法读取视频。后来发现需要使用ffmpeg作为后端。但是使用使用pip install ffmpeg之后,安装完成ffmpeg之后,却还是无法实现。在github上发现详细的安装介绍https://github.com/scikit-video/scikit-video...

2018-10-23 11:19:05 8612

原创 学习过程中看到的优质博文记录(图像计算机视觉方面)

(1)Bag of words(BoW)“词袋”算法原理,对图像提取到的特征进行编码,消除冗余信息,获取相同的特征矢量长度。可以用于后续分类。https://blog.csdn.net/tiandijun/article/details/51143765...

2018-10-16 20:38:42 176

原创 Tensorflow+SSD使用原始权重并修改分类网络进行单目标检测

本文的源码地址是https://github.com/balancap/SSD-Tensorflow由于项目需要,需要对场景中的人体进行检测,但是原始的SSD网络是20种类别的网络,而只需要获取人的分类即可,当我按照其说明在具有两块1080Ti的服务器上训练8个小时,损失值降低到10左右,但是,其效果不如原始的权重参数的效果,因此,想修改网络连接,只保留最后一层的分类网络中对人体的分类。步骤如...

2018-09-27 18:05:27 2612 10

原创 Tensorflow(2)保存模型与恢复

###一、数据模型的保存使用saver类,自动保存tensorflow的图结构(***.ckpt.meta),参数取值(***.ckpt.data),以及目录下的文件列表(***.ckpt.index),还有一个checkpoint文件。定义变量变量操作变量初始化构建saver类使用保存模型参数到文件import tensorflow as tfv1=tf.Variable(...

2018-09-26 22:28:58 1416

原创 Tensorflow(1)进行多维矩阵的拆分与拼接

最近在使用tensorflow进行网络训练的时候,需要提取出别人训练好的卷积核的部分层的数据。由于tensorflow中的tensor和python中的list不同,无法直接使用加法进行拼接,后来发现一个函数可以完成tensor的拼接。函数形式如下: tf.concat(concat_dim,values,name='concat')其中,第一个参数表示需要拼接的多维tensor,并且可以...

2018-09-26 19:38:21 14104 1

转载 ubuntu中mendeley无法使用中文解决方案

mendeley跨平台,免费的优点足以让人爱上它,但是该文献管理器在ubuntu系统下无法进行中文注释,后来终于发现了一个可用的解决方案,转载如下。 终端输入定位文件位置locate libfcitxplatforminputcontextplugin.so将上述文献拷贝到mendeley的安装路径当中,具体位置是 /opt/mendeleydesktop/plugins/qt/plu...

2018-09-11 21:52:20 8344 6

原创 视频行为识别论文阅读[4]

[9]A Key Volume Mining Deep Framework for Action Recognition[2016CVPR] 之前介绍的文章很多都是不同的融合技巧,这一篇文章是从输入入手,提取关键帧进行检测。

2018-09-11 17:59:59 763

原创 视频行为识别论文阅读[3]

[3]Deep Local Video Feature for Action Recognition[CVPR2017] 这篇文章是TSN网络的一种改进,其首先使用TSN提取局部特征,并探索了从网络的那一层提取特征比较合适,实验结果表明在最后一个卷积层提取特征具有更好的效果,作者认为有三个原因:(1)卷积层相对于全连接层有更少的参数,具有更少的过拟合风险(2)全连接层没有保存空间信息(3)后期的...

2018-09-09 18:56:40 2174

原创 视频行为识别阅读[2]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016]

[1]Temporal Segment Networks: Towards Good Practices for Deep Action Recognition[2016](TSN网络)介绍:(1)对于长序列的学习能力在理解视频行为上具有重要意义,但是主流的双流法和C3D通常只是聚焦于表面或者是短时间序列的学习(C3D的输入是连续的16帧,而双流法是依靠前后两帧计算出来的光流)。Lon...

2018-09-05 22:30:36 1171

原创 使用anaconda创建虚拟环境安装不同深度学习框架

使用anaconda安装tensorflow等框架,可以先通过anaconda创建虚拟环境,然后在每一个虚拟环境下装上不同的版本的框架(例如在python2上安装一个tensorflow,在oython3上安装一个tensorflow)。并且如果需要删除也比较方便,而不影响这个系统。一、在虚拟环境中安装tensorflow和keras主要翻译自tensorflow的安装教程,这里添加了对虚...

2018-08-27 17:19:54 12130 1

原创 Tensorflow(0)基础概念

tensorflow基础概念一、第一个简单计算样例tensorflow是基于计算图的,因此,需要先建立图中的连接,然后运行图图的连接可以想象成做流程图,例子中a,b,result就是建立流程图中的各个节点以及连接方式import tensorflow as tfa=tf.constant([1.0,2.0],name='a')b=tf.constant([2.0,3....

2018-08-19 21:11:46 342

原创 将一台ubutnu系统的电脑作为服务器使用

一、 功能介绍将Ubuntu系统的服务器功能打开,可以使用其他电脑对其实现远程访问,一般将硬件性能较好的电脑开启作为服务器,使用性能一般的电脑对其进行访问。二、开启SSH 服务step1:检查主机有没有ssh服务功能,输入如下命令ssh localhost如果出现ssh:ssh:connect to host localhost port 22: Connection ...

2018-08-16 22:45:29 3413 1

原创 视频行为识别[1]Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recognition

 2018年论文[1]Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recognition[CVPR2018] 题目:光流引导特征:快速,稳健的视频运动表示(OFF) 摘要:运动表示在视频人体行为识别中扮演者重要角色.在本研究中,我们介绍一种新的紧凑的运动表征方法用于视频行为识别,...

2018-07-27 10:50:09 882

原创 Stanford curriculum cs231n学习记录(2)神经网络基础

五、神经网络基础神经网络系统理解:数学上,神经网络中的每一个神经元就是一个线性单元(f=Wx+b)加上一个激活函数,这个激活函数是一个非线性系统。线性系统在高维空间中线性划分区间,而神经网络由于引入了非线性环节,因此可以使用曲线划分空间。除此之外,神经网络多层神经元的引入增加了拟合函数的复杂度,因此,应该具有更好的拟合效果。如果从生物神经系统上进行解释,神经元通过自己的许多树突获取信号(线性单...

2018-07-20 09:39:47 280

原创 Stanford curriculum cs231n学习记录(3)卷积神经网络与计算机视觉任务

一、单个物体的分类与定位(图片的分类与定位)任务要求:一幅图像上只有一个物体,识别这个物体的类别并且在图片中进行框选。思路一: step1:训练或者是下载一个目标识别的网络(eg.AlexNet、VGG、GooLeNet) step2:在下载好的网络的特征提取层之后加入一个新的头部,用于框选回归(位置表示(x,y,w,h)) step3:使用SGD和L2损失训练新的上面的全连接层 ...

2018-07-17 14:35:18 450

原创 Stanford curriculum cs231n学习记录(1)神经网络前期知识

一、计算机视觉历史回顾与介绍边缘定义了形状,大脑对视觉信息的的处理是基于边缘与形状的。视觉处理从一些简单的形状开始,而不是一个整体;视觉是分层的。 Convolutional Neural Network (CNN) has become an important tool for object recognitionConvolutional Neural Network (CNN)...

2018-05-30 22:10:11 320

转载 linux下局域网内文件共享方式(Ubuntu系统)

我有两台Ubuntu系统的电脑,常常想要它们之间相互传输文件,但是网上大多数资料是关于如何在windows和Ubuntu之间相互传输文件,后来查询资料发现可以通过最简单的命令行实现。具体操作如下: 1. 局域网内的电脑需要安装ssh服务,相信大部分人都已经安装过了,没有安装通过下面方式安装:命令行:sudo apt-get install ssh2.将本地文件复制到目标机器中...

2018-05-29 19:37:46 9689 1

原创 Jeston TX2学习笔记(5)——tegra_multiplemedia_api的使用

tegra_multiplemedia_api在刷机完成之后,在TX2上自动安装,其主要用于多媒体中的音视频的编解码(YUV和H264/H265);视频格式转换(jpg与YUV格式之间);视频格式之间的尺度变换;直接从摄像头获取数据进行编码;在TX2中也可以使用功能强大的ffmpeg完成上述操作,但是TX2这种自带的tegra_multiple_api使用了cuda指令进行GPU加速,更好的利用了...

2018-05-29 09:37:45 3812 1

原创 Jeston TX2学习笔记(4)——使用Nsight Eclipse Edition对TX2进行交叉编译

https://blog.csdn.net/lg1259156776/article/details/77227238

2018-05-27 21:20:48 2710 2

原创 linux下编写C/C++代码须知———串讲

一、C/C++的编辑编译与链接敲代码的过程就是编辑过程,在编辑完成程序后需要经过编译和链接两个步骤才可以把程序变成我们所需要的可执行程序。编译过程(包括预处理、编译,汇编(test.s到test.o)三个过程)最终在linux系统上生成.o文件,在windows系统上生成.obj文件。这个过程会将.cpp文件中包含的头文件添加到.cpp文件中,意思大概就是用头文件里面的具体内容替代incl...

2018-05-24 15:52:57 16114 4

转载 gcc、make、makefile、cmake、cmakelists区别

转自:http://www.zhihu.com/question/36609459 辉常哥转自:https://blog.csdn.net/zhangchen1003/article/details/510301121.gcc是GNU Compiler Collection(就是GNU编译器套件),也可以简单认为是编译器,它可以编译很多种编程语言(括C、C++、...

2018-05-22 19:09:32 802

原创 视频监控系统的构建(2)———jrtplib库的使用教程(RTP数据的发送与接收)

可以对照jrtplib样例1和2看以下内容。一、创建一个RTP对话的步骤:1.使用RTPSession类创建一个会话对象sess/session。2.通过RTP会话的参数类RTPSessionParams创建一个参数设置的对象sessparams/sessionparams。具体设置的属性有:时间戳单元(SetOwnTimestampUnit),是否允许接受自己的数据(SetAcceptOwnPa...

2018-05-20 22:20:55 2358

原创 Jeston TX2学习笔记(2)——jetpack

一、Jetpack是什么    jetpack是jeston的SDK(软件开发工具包),用于支持开发者在jeston上所需要的开发套件,和主机环境平台。具体有以下作用:一个装载到Jeston中的操作系统(ubuntu,当TX2系统出现问题时,可以通过刷机重装ubuntu系统)开发工具(可以在刷Jetpack过程中选择所需要的,这些开发工具在刷机完成后,在系统中都已经安装成功)提供CUDA组件(帮助...

2018-05-15 18:08:28 2119

原创 Jeston TX2学习笔记(3)---Opencv4Tegra的使用以及过程中的问题

在对TX2进行刷机后,在TX2中就已经安装好了Opencv4Tegra,可以直接进行编程。

2018-05-15 15:31:58 3101

原创 Jeston TX2学习笔记(1)——介绍、快速开始

以下部分内容 是翻译了英伟达Jeston TX2开发套件快速开始手册。1 介绍    NVIDA Jeston TX2套件是一个用于AI计算的全功能开发平台,通过预装的Linux系统环境(具体为ubuntu系统)帮助使用者快速的启动并运行。开发套件包含许多通用的API接口并且支持英伟达所有的开发工具。该开发套件板载了许多硬件接口,可以灵活的扩展相关应用。    在网址https://develop...

2018-05-05 13:41:53 6386 2

原创 ubuntu 系统下无法实现git clone问题

        在尝试了很多次子coding和github网站上均无法实现git clone命令时时,确认自己已经在本机上生成了ssh key,也已经将SSH 公钥添加到coding或者是github中,需要注意自己有没有在ubuntu系统中安装ssh服务,以及有没有开启SSH服务。输入 $ ssh localhost显示:ssh: connect to host localhost port 2...

2018-04-16 20:11:18 11692 7

原创 数据结构-最小生成树

prim算法和Kruskal算法是数据结构-图概念中的经典算法,是一种通过在加权连接图中寻找最小生成树的方法。应用场景例如:如何在不同的地点铺设管道,使得使用的管道长度最短。prim算法描述:选择任意顶点作为生长点(假设为1号顶点),判断该点与其邻接点之间的距离,选择最短的一条(这是找到的最小生成树的其中一条路径)(假设为3号顶点),判断3号顶点与其邻接点之间的距离(除去与1号邻接点),判断1号邻...

2018-04-13 10:32:45 471

原创 智能视频监控系统的构建--序

最近根据项目要求需要搭建一个智能化的视频监控系统,学到了一些有关视频监控的知识,在该项目进行中,会持续将该系统的搭建流程以及技术要点进行分享简易的视频监控的组成:视频监控系统最简易的组成方式是 由服务端(前端)到客户端(后端),前端负责采集视频信号&gt;&gt;&gt;压缩视频信号&gt;&gt;&gt;网络数据传输,后端进行网络数据接收&gt;&gt;&gt;视频信号的解码&gt;&gt;&g...

2018-04-10 09:02:26 516 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除