gdymind-CSDN博客

原创 CS231n Lecture 11：图像分割与检测（各种R-CNN, YOLO, SSD）

CS231n Lecture 11：图像分割与检测@(人工智能和机器学习-default)图像的分割和检测任务有不同的粒度，我们首先明确一下有关概念：语义分割（Semantic Segmentation）：将每个像素标注为某一类别，是一个分类问题。该任务不区分实例，即同一类别的不同实例都标为同一颜色（如下图中的两头牛）；单物体检测：只识别图像中的一个物体，并标出bounding box...

2018-12-20 21:41:34 4223

原创 CS231n lecture 9：各大经典网络 AlexNet/VGG/GoogleNet/ResNet（上）

本篇将深入介绍当前的应用和研究工作中最火的几个CNN网络架构——AlexNet、VGGNet、GoogleNet和ResNet，它们都在ImageNet分类任务中有很好的表现。另外，本篇也会粗略介绍一些其他的架构。LeNet-5回顾我们先来回顾一下最基本的LeNet，它可以说是首个效果比较好的comNet。它使用了5x5的卷积核，stride为1。池化层卷积核是2x2的，stride为2。最后...

2018-10-13 22:05:03 3991

原创图像质量评价之结构相似性SSIM（中）

在上一篇文章中，我们介绍了对图像质量进行评价的必要性、主观评价和客观评价的两种标准，以及设计符合人类直觉的评价标准的困难性和重要性。本来这篇文章想把我们的主角SSIM讲完，但是发现前面需要写的铺垫有点长hhh，所以本文是作为一个过渡，系统的讲解一下设计图像评价标准的过程和目前的缺点，SSIM的详细讲解将在下一篇文章中介绍（保证下一篇是最后一篇，别打我QAQ）提前预告一下，这一篇可能比较无聊==...

2018-10-11 18:00:46 6756 14

原创图像质量评价之结构相似性SSIM（上）

这篇文章主要介绍对图像质量进行打分评价的一个很经典的指数——结构相似性（structual similarity, SSIM）。具体一点儿来说，图像在各种情况下都有可能失真，比如经过传输、压缩和缩放等等。图片变换之后，我们自然很想知道失真图像（distorted image）的质量如何，也就是要对它进行图像质量评价（image quality assessment）。注意这种评价应用很广泛，比如...

2018-10-06 10:27:33 18580 3

原创 Pytorch中常见的报错解决方案

本文用于记录所在pytorch所遇到过的运行时错误，持续更新。变量所在设备（CPU，GPU）不一致问题RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same可能原因：现在假设代码要在GPU上运行，并且你已经进行my_model.to...

2018-10-03 20:05:03 11818 1

原创 Pytorch中的optimizer

与优化函数相关的部分在torch.optim模块中，其中包含了大部分现在已有的流行的优化方法。如何使用Optimizer要想使用optimizer，需要创建一个optimizer 对象，这个对象会保存当前状态，并根据梯度更新参数。怎样构造Optimizer要构造一个Optimizer，需要使用一个用来包含所有参数（Tensor形式）的iterable，把相关参数（如learni...

2018-09-14 21:28:48 35425 9

原创一文读懂GAN, pix2pix, CycleGAN和pix2pixHD

本文翻译、总结自朱俊伟的线上报告，主要讲了如何用机器学习生成图片。来源：Games2018 Webinar 64期：Siggraph 2018优秀博士论文报告人员信息主讲嘉宾姓名：朱俊彦（Jun-Yan Zhu）现状：麻省理工学院博士后（PostDoc at MIT），计算机科学与人工智能实验室（Computer Science and Artificial In...

2018-09-14 04:42:30 67561 36

原创 Pytorch中的contiguous理解

最近遇到这个函数，但查的中文博客里的解释貌似不是很到位，这里翻译一下stackoverflow上的回答并加上自己的理解。在pytorch中，只有很少几个操作是不改变tensor的内容本身，而只是重新定义下标与元素的对应关系的。换句话说，这种操作不进行数据拷贝和数据的改变，变的是元数据。这些操作是： narrow()，view()，expand()和transpose()举个栗...

2018-09-12 15:35:43 33444 5

原创认识色彩

本文为《图像处理中的数学修炼》一书第8章第一节的笔记按理说这些基础芝士应该挺熟的了，但再来看看还是有不少收获，尤其是眼睛那个部分。颜色与眼睛从产生上说，颜色是光作用与人眼的结果。人能感受的波长范围内的光波叫可见光。人眼中有两种感受颜色的细胞——锥状细胞和棒状细胞（也叫杆状细胞）。其中： 1. 锥状细胞有三种，每一种都有自己主要（注意不是唯一）能感受的颜色。这三种分别能感受红色...

2018-09-09 15:39:07 1035

原创网络可视媒体的智能计算-胡事民

本文为胡事民教授在山大做报告的笔记，现场见下图：可视媒体是承载视觉信息的媒体类型，如图像、视频等，它具有网络化、海量和无序涌现等特征。可视媒体计算的研究意义可视媒体作为一种信息承载的介质，是用来表达语义信息的。那么就有一种介质与信息之间相互转化的问题。转化方向正反两种，举个栗子说明一下： 1. 可视媒体→→\rightarrow语义信息：比如看到画面，理解其中发生的事件、各主题之...

2018-09-09 14:16:42 2147

原创从卷积到residual dense network: Convolution, ResNet, DenseNet and ResDenseNet解读

Convolution把各个*input feature maps分别经过一个kernel的卷积结果相加，得到一个* output feature map：Output feature map’s shapeConvolution layerConvolution layer的output feature map的shape与下列变量有关： - input featu...

2018-09-07 15:59:32 3256

原创 PyTorch中的PixelShuffle

感性认识一般的convolution操作会使feature map变小，但当我们的stride=1r&lt;1stride=1r&lt;1\text{stride} = \frac{1}{r} < 1时，可以让卷积后的feature map变大，这个新的操作叫做sub-pixel convolution，具体原理可以看Real-Time Single Image and Video Sup...

2018-09-04 18:13:02 25303 7

原创彻底搞懂Lab 颜色空间

本文参考wikipedia，并加入了自己的理解，有不对的地方多多指教~名称在开始之前，先明确一下Lab颜色空间（Lab color space）的名字： - Lab的全称是CIELAB，有时候也写成CIE L*a*b* - 这里的CIE代表International Commission on Illumination（国际照明委员会），它是一个关于光照、颜色等的国际权威组织。...

2018-09-04 00:53:31 98662 8

原创 PyTorch中的Dataset、Dataloader和_DataloaderIter

DatasetPytorch中数据集被抽象为一个抽象类torch.utils.data.Dataset，所有的数据集都应该继承这个类，并override以下两项： - __len__：代表样本数量。len(obj)等价于obj.__len__()。 - __getitem__：返回一条数据或一个样本。obj[index]等价于obj.__getitem__。建议将节奏的图片等高负载的操作放...

2018-08-30 19:16:05 11319 5

原创 Autograd：Pytorch 中的自动微分机制讲解

本文翻译、整理自Autograd官方documentation本文讲解了Autograd——pytorch中用于自动求微分的模块。下面的内容不需全部掌握，但读一下还有有助于加强理解的。在backward的过程中排除一部分子图Tensor的属性requires_grad代表它是否需要求梯度。注意除了这个属性除了可以被显式地设置性之外，还会被一个规则所定义：如果一个Tensor AAA...

2018-08-30 16:43:45 3125

原创 Ubuntu配置GPU版本pytorch环境（含NVIDIA驱动+Cuda+Cudnn）

本文更新于2018年8月概述步骤如下： 1. 安装Ubuntu 2. 安装NVIDIA 显卡驱动 2. 安装NVIDIA Cuda 3. 安装NVIDIA CuDNN 4. 安装GPU版本的PyTorch安装Ubuntu系统版本选择之前pytorch是不支持Windows的，现在貌似是支持了，但我们还是选择Ubuntu。注意Ubuntu的版本要与cuda兼容，...

2018-08-28 19:56:29 34397 4

原创 OpenGL中的异步缓存传输Asynchronous Buffer Transfers

本文介绍在OpenGL中buffer的异步传输，翻译、摘抄自OpenGL Insights Chapter 22。目前更新到第三节，待续（后面还没看懂）Terminology为了后文表述方便，现说明一些要使用术语： 1. GPU被称作device 2. 当调用OpenGL functions，相关命令会放入一个队列队列异步地依次执行，这个队列叫device command queu...

2018-07-24 16:19:13 2329

原创 LearnOpenGL.com笔记

* 本文用作学习learnOpenGL.com的备忘1. Hello TriangleRendering pipeline（蓝色部分可编写shader程序）: some primitives: GL_LINES: Vertices 0 和1 是一条线，Vertices 2 and 3 是一条线，依次类推。GL_LINE_STRIP: 所有相邻点组成一条线。GL_LINE_LOO...

2018-06-12 15:35:54 682

原创线性代数及其应用笔记

线代最近好多地方都要用到，然而之前学的太渣啦，这次复yu习xi一遍记一下，方便之后查阅~第1章线性代数中的线性方程组线性方程组等价⇔⇔\Leftrightarrow解集相同⇔⇔\Leftrightarrow增广矩阵行等价线性方程组的解：null/one/infinite线性方程组相容：有解（one/infinite）行初等变换：倍加：加上另一行的倍数对换：两行互换倍乘：一...

2018-05-27 01:00:21 7379

原创 [kuangbin带你飞]专题十六A-K KMP & 扩展KMP & Manacher 题目分析

[kuangbin带你飞]专题十六 KMP & 扩展KMP & Manacher 题目分析，含源码

2017-11-13 02:03:15 445

原创国内外常用OJ介绍

国内外常用OJ

2017-11-07 13:12:34 9624 1

原创从零开始了解JavaScript

JS简介

2017-11-01 02:14:07 393

原创简单四步安装Windows10+Ubuntu双系统教程

简单4步安装Windows10+Ubuntu双系统

2017-10-31 05:29:22 992

原创英文Windows 10中的中文显示不正常问题解决方案

英文Windows 10中的中文显示不正常问题解决方案

2017-10-31 02:33:14 15086 2

原创 Sublime Text 3安装SublimeCodeIntel并配置JavaScript自动补全

Sublime Text 3安装SublimeCodeIntel并配置JavaScript自动补全

2017-10-30 23:04:27 4090 1

原创 Sublime Text 3安装Package Control

Sublime Text 3第一步，安装Package Control

2017-10-30 20:55:10 261

原创 JSON入门详解

JavaScript入门经典第5版-第八章-JSON简介

2017-10-29 15:11:01 720

原创 [贪心] cf883K Road Widening

c883K road widening题解

2017-10-22 10:34:13 890

原创 [二分][dp] cf883I Photo Processing

ACM cf883I题解

2017-10-22 10:04:09 956

原创 CS231n Convolutional Neural Networks for Visual Recognition

CS231n CNN图像分类笔记

2017-10-19 23:33:25 394

原创模拟的操作系统nachos解读

对一个模拟的操作系统nachos解读，对理解操作系统很有帮助

2017-10-17 19:05:44 968

原创 CNN入门paper

CNN入门的paper

2017-10-16 19:28:22 974

原创微积分-刘建亚笔记

高数笔记，各领域可能需要高数知识储备

2017-10-15 10:58:24 1000

原创 Introduction to D3

D3入门

2017-09-26 21:48:53 270

原创深度学习 21天实战caffe 前三天笔记

深度学习 caffe笔记

2017-09-26 07:46:44 2293

原创李宏毅机器学习 10.卷积神经网络笔记

李宏毅机器学习-10.卷积神经网络使用CNN处理图像的原因：性质一：Some patterns are much smaller than the whole image（如鸟的图像中有鸟嘴这个小pattern）. A neuron does not have to see the whole image to discover the pattern. Connecting to small r

2017-09-26 07:28:27 1823

原创机器学习-周志华-第五章笔记 CNN

Chapter 5 神经网络-机器学习-周志华5.1神经元模型神经网络：具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。神经元模型：一个神经元收到的刺激超过阈值（threshold/bias），它就会被激活。概括为M-P神经元模型：n个带权输入→\rightarrow与threshold比较→\rightarrow激活函数处理产生输出。

2017-09-26 07:22:38 1519

原创 [dp]cf gym 101485B; bzoj4426 Better Productivity(NWERC 2015 B)

dp题目

2017-09-20 10:29:18 830

原创 OpenCV环境搭建及简单示例

opencv入门

2017-09-15 08:45:34 567

原创 [树形dp][trie]cf856B Similar Words

@(ACM题目)[字符串, 图论, trie, 染色]Description Let us call a non-empty sequence of lowercase English letters a word. Prefix of a word x is a word y that can be obtained from x by removing zero or more last l

2017-09-13 07:20:28 633

空空如也

空空如也