zjjszj-CSDN博客

原创 linux常用总结

1.编辑文件：在文件路径上：vi '文件名'.txt，完成后：：q退出2.新建文件/文件夹：torch '文件名'。新建文件夹：mkdir '文件夹名'3.删除文件/文件夹：rm '文件名'删除文件夹：rmdir '文件夹名'4.复制文件：cp '文件名' '文件名' 复制文件到目录：cp -i '文件名' '目录名' 复制文件夹->文件夹：cp -r‘文件夹名’ ‘文件夹名’ 如果目的路径已存在：源目录一起被复制 ...

2021-02-28 11:33:07 152

原创 Transformer模型

主要用于翻译，有两部份组成：encoding和decoding。1 encodingencoding如下图所示：1.1 self-attention计算单词与其他单词的相关性。输入：input embedding。输出：每个单词之间的相关性。包含3个向量矩阵：Query、Key、Value，计算相关性的计算方法：Query=embeddingWqValue=embeddingWvKey=embeddingWkrelevance=ValueSoftmax(Query*Key)1.

2021-01-24 14:34:23 334

原创 discriminate、generative、conditional generative模型

discriminate、generative、conditional generative模型discriminate model：输入图片x和label y，学习概率。结果需要归一化也就是说各种类别的概率需要相互竞争，之和为1.generative model：输入为图片x，学习分布。conditional generative model：输入为图片x和label y，可以理解为是一种generative model但是带label。generative model产生的原因：一个例子比如预测

2020-09-15 11:52:44 583

原创 RNN

之前刚开始接触AI的时候并没有学习RNN，现在补上。首先为什么使用RNN呢？RNN相比CNN有哪些优势？因为有些问题存在以下特点，导致必须使用RNN来解决。输入和输出的长度不固定。希望能够共享特征在问题的不同位置上。...

2020-09-08 22:04:10 474

原创 DeepLab系列

本系列是基于像素分割的语义分割算法，目前分为3个版本。DeepLabV1问题作者认为语义分割需要解决三个问题：过多的pool导致图片分辨率降低。目标的大小变化。由于DCNN（深度卷积圣经网络）具有不变性（图片翻转后类别不变），有利于分类任务，但是不利于稠密的预测任务比如语义分割，会损失定位精度。解决1 过多的pool导致图片分辨率降低。去掉最后几个axpool（s=2->1）将接下来的卷积层转为膨胀卷积。膨胀卷积的作用：在没有加入参数和多余的计算情况下，扩大感受野。

2020-09-05 11:14:51 697

原创 show_cnn总结

这篇文章是对专栏show CNN写的一篇总结的文章。总体来讲，cnn可视化可以分为2种方法：特征可视化：这种方法显示图片所有特征信息，不能可视化对分类结果起到重要作用的区域。如deconvnet、guided propagation。类激活图：这种方法可以可视化对分类结果起到重要作用的区域。如CAM系列。...

2020-09-02 11:48:08 139

原创 deconvnet

Visualizing and Understanding Convolutional Networks于2014年发表于ECCV。该文章是第一篇提出可视化卷积神经网络的文章。使用Deconvolution技术（Zeiler et al., 2011）重建源图中对某类起重要作用的区域。

2020-08-27 22:14:09 373

原创 Guided backpropagation

文章：STRIVING FOR SIMPLICITY:THE ALL CONVOLUTIONAL NET，于2015年发表于ICLR，文章提出一种最简化的模型，网络只由卷积层构成。当前展示模型效果的方法DeConvolution要求分类网络必须含有pool操作，因此并不适用于本网络，因此在DeConvolution基础上进行改进提出了guided backpropagation。最简单但是有效的网络整个网络由卷积层构成。替换pool有两种方法：将其前一层的卷积层中的stride+1。但是该网

2020-08-26 22:38:00 2029

原创插值

按照cv2包中函数cv2.resize()：def resize(src, dsize, dst=None, fx=None, fy=None, interpolation=None):interpolation的插值方式有6种：中文名常量名备注最近邻插值INTER_NEAREST双线性插值INTER_LINEAR默认放大推荐双三次插值INTER_CUBIC放大推荐（较慢）局部像素重采样INTER_AREA缩小推荐，放大相当于NEAREST

2020-08-25 16:02:13 270

原创 CAM系列

这篇文章2016年发表于CVPR。在全连接层能够破坏卷积层的特征（比如记住物体位置等）的基础上，研究了用GAP/GMP加softmax代替全连接层时，GAP与GMP的区别并且证明了GAP可以记住物体的位置，需要注意的是不全代替所有的全连接层，因为需要输出所有类别的概率。为了展示定位的效果，提出一直种新的可视化方法:CAM（class activation map）。创新证明了GAP不仅起到正则化的作用，并且可以定位物体。试验表明GAP（global average pool）更适用于定位，GAP与G

2020-08-23 12:55:05 910 2

原创英文积累

电影这个杀手不太冷（leon）Did you follw the procedure?你是按照程序吗？I haven`t no time for the Mickey Mourse bullshift!我没有时间在这个米奇屋里听你们扯淡！他吗的闭嘴！buck美元I mean a big one!真是一个绝妙的想法！Can i have a word with you?我可以和你谈谈吗？Because if there is just a little bit of love i

2020-08-17 15:40:46 160

原创 TCTS: A Task-Consistent Two-stage Framework for Person Search

该篇文章的解读我放在知乎上了链接.

2020-08-16 20:23:51 264

原创 Norm-Aware Embedding for Efficient Person Search

引言该篇文章来自CVPR2020，需要更多的数学知识，但是代码开源。方法文章认为：问题：端到端的网络中，检测和重识别的目的不同。解决：将行人向量映射到极坐标中，向量范数部分区分背景和行人，向量角度部分用于重识别。作者通过下图展示了通常的方法与本文的方法的不同。图中黑线表示背景，彩线表示不同的行人。灰色部分表示背景与行人的决策边界。图a表示通常的l2 normalized 的embedding在空间的表示。图b表示在极坐标下的表示。从图a中可以看出，背景的空间压缩行人的空间，使得行人类间

2020-08-14 21:37:05 1345

原创 Bi-directional Interaction Network for Person Search

引言该篇是发表于CVPR2020年的一篇文章，注意到，在CVPR2020被录用的文章中，研究行人查找方向的所有文章均是中国人。文章设计的网络结构比较简单，只是在通用的端到端模型上加了一个分支用于与端到端分支中重识别部分共享参数。文章实验结果更适用于PRW数据集。该篇文章认为：目前存在的问题：检测网络和重识别网络共享backbone时，由于感受野的原因，行人特征图包含了许多边框外的信息因此不利于重识别。该篇文章从另一个角度前向传播的角度发现了一个新的问题，众所周知的一个问题是行人检测与行人重识别

2020-08-14 11:28:26 499

原创 Faster-RCNN

1 过程之前看过该篇论文但是理解不太深刻，如今结合代码看理解的更深一层。急忙做下记录以备日后复习。分为七个部分：Backbone、RPNHead、RPNOutput、RPNTopProposals、RoiHead、PostProcess_Detection。Backbone用于抽取图像特征，如Resnet50-FPN。PRNHead将抽取的特征图分别经过两个卷积用于二分类和回归，形状分别为：(N,1∗num_anchors,H,W)(N, 1*num\_anchors, H, W )(N,1∗

2020-08-13 21:39:12 113

原创 FCN

全称Fully Convolutional Networks for Semantic Segmentation.是一篇2015年在CVPR上发表的语义分割的文章。创新第一次提出全卷积神经网络的结构。第一个提出端到端训练的语义分割模型并取得当前最佳。网络可以接受任意大小的图片。提出跳跃连接结构（多尺度）：融合不同分辨率的特征图以获得更加精细的特征。网络结构文中使用修改后的vgg16模：修改最后一个maxpool之后的全连接层，用一个卷积层代替（1x1，channels=classes，用于

2020-07-25 12:12:27 241

原创 Vue

一、常用指令1 插值表达式：{{msg}}2 v-text：与插值表达式类似，默认没有闪烁问题。3 v-html：与v-text类似，将内容按照HTML显示。4 v-cloak：解决插值表达式的闪烁问题。5 v-on：绑定事件，简写@6 v-bind：绑定属性，简写：7 v-model：实现表单数据和Model之间的双向绑定。只有这一个指令为双向绑定。二、事件修饰符1 .stop...

2020-07-25 10:06:57 117

原创基于深度学习的图像语义分割综述

本文参考期刊基于深度学习的图像语义分割方法综述∗田萱, 王亮, 丁琪1 概述

2020-07-22 17:51:32 229

原创 YOLOV4

这篇论文的创新点很少，目的是在提高准确率的同时保证运行速度，同时为了每个人都可以运行出相同的结果，试验条件选用的是单GPU（1080Ti、V100GPU等）。论文使用各种技术以提高试验结果，是在YOLOV3上的改进。论文列出了在数据增强、激活函数等方面的各种技术然后做实验做对比。技术如下：分类：backbone CSPResNeXt-50（）、 CSPDarknet-53 （）。数据增强：MixUp（）、CutMix（）、Mosaic（）、Bluring（）。正则化：label smoothing

2020-06-24 22:54:42 296

原创何凯明初权重始化

本文为Xavier的姊妹篇，论文名称：Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification，2015年一篇期刊。论文的贡献有两个：因为Xavier限制激活函数为线性的，因此并不适用Relu激活函数，因为提出一种新的初始化方式。提出基于LRelu的激活函数，PRelu。1 初始化参照了Xavier论文的思想，该论文的思想是前向传播时保证每层激活函数的输入的方差相等，反向

2020-05-26 22:59:24 1107

原创 Xavier

正确的权重初始化有利于网络收敛，权重初始化的目的是防止激活值饱导致梯度不能传播。本篇文章介绍两种权重初始化方式：Xavier和hekaiming。1 Xavier初始化Xavier初始化是2010年由Xavier提出来的，论文名称是Understanding the difficulty of training deep feedforward neural networks。这篇文章假设激活函数有如下性质：当激活函数是线性激活函数。满足f′(0)=1f'(0)=1f′(0)=1。激活函数关于原

2020-05-26 18:28:51 728

原创 YOLO1-3

0 引言Yolov1（You Only Look Once: Unified, Real-Time Object Detection）是2015年。Yolov2（YOLO9000: Better, Faster, Stronger）是2016年文章。Yolov3（YOLOv3: An Incremental Improvement）是2018年文章。Yolo是一个集其他网络优点于一身的检测...

2020-04-25 18:29:42 505

原创 Spatial Transformer Networks论文

0 引言该论文是2015年发表在nips会议上的一篇文章，提出spatial transformer结构，可以改变输入特征图中某一对象的大小、形状。可用于基于注意力机制的网络。可以在CNN中的任意位置插入任意多个spatial transformer。1 背景卷积神经网络中最大池化支持对象发生微小变动的空间不变性（平移、旋转等），然而当对象发生比较大的变换时，就不支持空间不变性，因此作者提出...

2020-04-19 17:45:50 197

原创 Ai随笔

1、ResNet50结构

2020-04-08 20:29:10 159

原创 DropBlock: A regularization method for convolutional networks论文

1、引言该篇论文是谷歌大脑2018年发表于NIPS的一篇防止过拟合并提高精度的论文。借鉴了dropout思想，dropout在全连接层随机drop一些神经元，论文认为使用同样方法用于卷积层效果并不会好因为卷积层的神经元在空间上和附近的神经元相关联，因此丢失的信息仍会传到下层当中，网络仍会发生拟合。论文提出一种结构化的drop块（dropblock）来解决该问题。2、DropBlock构造方法...

2020-04-06 22:16:11 299

原创 RetinaNet论文

1、引入摘要：本文是2017年何凯明 ICCV最佳学生论文奖。论文认为单阶段目标检测低于两阶段的原因是正负样本不均衡，为了降低影响，提出focal loss损失函以及检测网络结构，提升了性能。优点：无论是精度还是速度都是全面超越。创新点：提出focal loss损失函苏。提出目标检测网络结构。可以用于多标签分类（损失函数使用的是binary_cross_entropy_with_lo...

2020-04-04 18:47:06 435

原创 AlignedReID论文

一、引入介绍： 2017年的一篇行人重识别的论文。提出一种基于动态规划算法的行人对齐方法再使用其他技巧（三元组损失函数联合交叉熵损失函数、相互学习方式、重排序）取得了当前最佳，测试时只需要使用全局分支特征。创新点：提出基于动态规划算法对齐行人。优点：动态规划算法不需要训练不用调参。缺点：算局部距离时，未对齐的距离值也计算在内。二、网络结构分为两个分支：全局和局部分支。三、损失函...

2020-03-15 00:11:29 281

原创 CornerNet论文

一、引入cornernet思想来源于人体姿态评估，与前人研究不同，不使用anchor，而是使用关键点检测（左上角和右下角），是单阶段检测器。1创新点（2）1.1第一个使用关键点作为检测的方法。1.2提出corner pooling layers因为有的图像的边框角附近的局部信息太少，使用cornerpoolinglayers能更好的定位。2优点2.1 使用修...

2020-03-11 20:15:21 187

原创 gpu、cuda、nvcc的关系

gpu(Graphics Processing Unit):一个图形图像处理器芯片类似于cpu。cuda(Compute Unified Device Architecture):一种通用并行计算架构。nvcc(Nvidia CUDA Compiler):cuda编译器，下载了cuda就包括了nvcc。...

2019-11-23 10:57:21 1330

转载 c++分离编译

为什么C++编译器不能支持对模板的分离式编译刘未鹏(pongba)C++的罗浮宫(http://blog.csdn.net/pongba)首先，一个编译单元（translation unit）是指一个.cpp文件以及它所#include的所有.h文件，.h文件里的代码将会被扩展到包含它的.cpp文件里，然后编译器编译该.cpp文件为一个.obj文件（假定我们的平台是win3...

2019-10-13 21:47:55 201

原创搭建识别食物模型时出现的错误

一、搭建第一级特征提取网络1RuntimeError: Expected object of scalar type Long but got scalar type Float原因：自己写的vgg16网络维度计算错误。解决方法：修改全连接层的神经原个数。2MSELoss损失函数的输入值计算错误。原因：[32，1]与[32]不同、需要Float类型、MSELoss用于分类。...

2019-08-20 17:21:37 362

原创 .net随笔

1、ASP.NET 是微软 .NET 框架的主要部分，是一种服务器端脚本技术，可以使（嵌入网页中的）脚本由 Internet 服务器执行。2、IIS 是 Windows servers 操作系统免费捆绑的组件3、ASP.NET 如何工作？当浏览器请求 HTML 文件时，服务器会返回该文件当浏览器请求 ASP.NET 文件时，IIS 会把该请求传递给服务器上的 ASP.NET 引擎

2015-09-19 16:34:37 169

CSDN《2017-2018中国人工智能产业路线图》V1.0

2018-08-23

代码之美（Java版本）

《代码之美》是Joit大奖书籍。介绍了人类在一个奋斗领域中的创造性和灵活性：计算机系统的开发领域。在每章中的漂亮代码都是来自独特解决方案的发现，而这种发现是来源于作者超越既定边界的远见卓识，并且识别出被多数人忽视的需求以及找出令人叹为观止的问题解决方案。《代码之美》33章，有38位作者，每位作者贡献一章。每位作者都将自己心目中对于“美丽的代码”的认识浓缩在一章当中，张力十足。38位大牛，每个人对代码之美都有自己独特的认识，现在一览无余的放在一起，对于热爱程序的每个人都不啻一场盛宴。虽然本书的涉猎范围很广，但也只能代表一小部分在这个软件开发这个最令人兴奋领域所发生的事情。 Andy Oram是O'Reilly Media的编辑。他从1992年开始就在这家公司工作，Andy目前主要关注自由软件和开源技术。他在O'Reilly的工作成果包括第一批Linux系列丛书以及2001年的P2P系列丛书。他的编程技术和系统管理技术大多都是自学的。Andy还是Computer Professionals for Social Responsibility协会的成员并且经常在O'Reilly

2018-08-23

数据结构与算法分析—C语言描述第二版(中文版)

作者: Mark Allen Weiss (维斯) 出版社: 机械工业出版社副标题: C语言描述原作名: Data Structures and Algorithm Analysis in C:Second Edition 原书曾被评为20世纪顶尖的30部计算机著作之一，作者Mark Allen Weiss在数据结构和算法分析方面卓有建树，他的数据结构和算法分析的著作尤其畅销，并受到广泛好评．已被世界500余所大学用作教材。在本书中，作者更加精炼并强化了他对算法和数据结构方面创新的处理方法。通过C程序的实现，着重阐述了抽象数据类型的概念，并对算法的效率、性能和运行时间进行了分析。全书特点如下： ●专用一章来讨论算法设计技巧，包括贪婪算法、分治算法、动态规划、随机化算法以及回溯算法 ●介绍了当前流行的论题和新的数据结构，如斐波那契堆、斜堆、二项队列、跳跃表和伸展树 ●安排一章专门讨论摊还分析，考查书中介绍的一些高级数据结构 ●新开辟一章讨论高级数据结构以及它们的实现，其中包括红黑树、自顶向下伸展树。treap树、k-d树、配对堆以及其他相关内容 ●合并了堆排序平均情况分析的一些新结果本书是国外数据结构与算法分析方面的标准教材，介绍了数据结构(

2018-08-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

CSDN《2017-2018中国人工智能产业路线图》V1.0

代码之美（Java版本）

数据结构与算法分析—C语言描述 第二版(中文版)

算法导论第二版

在线订票系统毕业设计

经典3层架构列子

程序员面试算法大全

空空如也

数据结构与算法分析—C语言描述第二版(中文版)