自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

gdymind的博客

计算机图形学、可视化、机器学习、ACM题解等计算机各方向技术

  • 博客(107)
  • 收藏
  • 关注

原创 CS231n Lecture 11:图像分割与检测(各种R-CNN, YOLO, SSD)

CS231n Lecture 11:图像分割与检测@(人工智能和机器学习-default)图像的分割和检测任务有不同的粒度,我们首先明确一下有关概念:语义分割(Semantic Segmentation):将每个像素标注为某一类别,是一个分类问题。该任务不区分实例,即同一类别的不同实例都标为同一颜色(如下图中的两头牛);单物体检测:只识别图像中的一个物体,并标出bounding box...

2018-12-20 21:41:34 4223

原创 CS231n lecture 9:各大经典网络 AlexNet/VGG/GoogleNet/ResNet(上)

本篇将深入介绍当前的应用和研究工作中最火的几个CNN网络架构——AlexNet、VGGNet、GoogleNet和ResNet,它们都在ImageNet分类任务中有很好的表现。另外,本篇也会粗略介绍一些其他的架构。LeNet-5回顾我们先来回顾一下最基本的LeNet,它可以说是首个效果比较好的comNet。它使用了5x5的卷积核,stride为1。池化层卷积核是2x2的,stride为2。最后...

2018-10-13 22:05:03 3991

原创 图像质量评价之结构相似性SSIM(中)

在上一篇文章中,我们介绍了对图像质量进行评价的必要性、主观评价和客观评价的两种标准,以及设计符合人类直觉的评价标准的困难性和重要性。本来这篇文章想把我们的主角SSIM讲完,但是发现前面需要写的铺垫有点长hhh,所以本文是作为一个过渡,系统的讲解一下设计图像评价标准的过程和目前的缺点,SSIM的详细讲解将在下一篇文章中介绍(保证下一篇是最后一篇,别打我QAQ)提前预告一下,这一篇可能比较无聊==...

2018-10-11 18:00:46 6756 14

原创 图像质量评价之结构相似性SSIM(上)

这篇文章主要介绍对图像质量进行打分评价的一个很经典的指数——结构相似性(structual similarity, SSIM)。具体一点儿来说,图像在各种情况下都有可能失真,比如经过传输、压缩和缩放等等。图片变换之后,我们自然很想知道失真图像(distorted image)的质量如何,也就是要对它进行图像质量评价(image quality assessment)。注意这种评价应用很广泛,比如...

2018-10-06 10:27:33 18580 3

原创 Pytorch中常见的报错解决方案

本文用于记录所在pytorch所遇到过的运行时错误,持续更新。变量所在设备(CPU,GPU)不一致问题RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same可能原因:现在假设代码要在GPU上运行,并且你已经进行my_model.to...

2018-10-03 20:05:03 11818 1

原创 Pytorch中的optimizer

与优化函数相关的部分在torch.optim模块中,其中包含了大部分现在已有的流行的优化方法。如何使用Optimizer要想使用optimizer,需要创建一个optimizer 对象,这个对象会保存当前状态,并根据梯度更新参数。怎样构造Optimizer要构造一个Optimizer,需要使用一个用来包含所有参数(Tensor形式)的iterable,把相关参数(如learni...

2018-09-14 21:28:48 35425 9

原创 一文读懂GAN, pix2pix, CycleGAN和pix2pixHD

本文翻译、总结自朱俊伟的线上报告,主要讲了如何用机器学习生成图片。来源:Games2018 Webinar 64期 :Siggraph 2018优秀博士论文报告人员信息主讲嘉宾姓名:朱俊彦(Jun-Yan Zhu) 现状:麻省理工学院博士后(PostDoc at MIT),计算机科学与人工智能实验室(Computer Science and Artificial In...

2018-09-14 04:42:30 67561 36

原创 Pytorch中的contiguous理解

最近遇到这个函数,但查的中文博客里的解释貌似不是很到位,这里翻译一下stackoverflow上的回答并加上自己的理解。在pytorch中,只有很少几个操作是不改变tensor的内容本身,而只是重新定义下标与元素的对应关系的。换句话说,这种操作不进行数据拷贝和数据的改变,变的是元数据。这些操作是: narrow(),view(),expand()和transpose()举个栗...

2018-09-12 15:35:43 33444 5

原创 认识色彩

本文为《图像处理中的数学修炼》一书第8章第一节的笔记按理说这些基础芝士应该挺熟的了,但再来看看还是有不少收获,尤其是眼睛那个部分。颜色与眼睛从产生上说,颜色是光作用与人眼的结果。人能感受的波长范围内的光波叫可见光。人眼中有两种感受颜色的细胞——锥状细胞和棒状细胞(也叫杆状细胞)。其中: 1. 锥状细胞有三种,每一种都有自己主要(注意不是唯一)能感受的颜色。 这三种分别能感受红色...

2018-09-09 15:39:07 1035

原创 网络可视媒体的智能计算-胡事民

本文为胡事民教授在山大做报告的笔记,现场见下图: 可视媒体是承载视觉信息的媒体类型,如图像、视频等,它具有网络化、海量和无序涌现等特征。可视媒体计算的研究意义可视媒体作为一种信息承载的介质,是用来表达语义信息的。那么就有一种介质与信息之间相互转化的问题。转化方向正反两种,举个栗子说明一下: 1. 可视媒体→→\rightarrow语义信息:比如看到画面,理解其中发生的事件、各主题之...

2018-09-09 14:16:42 2147

原创 从卷积到residual dense network: Convolution, ResNet, DenseNet and ResDenseNet解读

Convolution把各个*input feature maps分别经过一个kernel的卷积结果相加,得到一个* output feature map:Output feature map’s shapeConvolution layerConvolution layer的output feature map的shape与下列变量有关: - input featu...

2018-09-07 15:59:32 3256

原创 PyTorch中的PixelShuffle

感性认识一般的convolution操作会使feature map变小, 但当我们的stride=1r<1stride=1r<1\text{stride} = \frac{1}{r} < 1时,可以让卷积后的feature map变大,这个新的操作叫做sub-pixel convolution,具体原理可以看Real-Time Single Image and Video Sup...

2018-09-04 18:13:02 25303 7

原创 彻底搞懂Lab 颜色空间

本文参考wikipedia,并加入了自己的理解,有不对的地方多多指教~名称在开始之前,先明确一下Lab颜色空间(Lab color space)的名字: - Lab的全称是CIELAB,有时候也写成CIE L*a*b* - 这里的CIE代表International Commission on Illumination(国际照明委员会),它是一个关于光照、颜色等的国际权威组织。...

2018-09-04 00:53:31 98662 8

原创 PyTorch中的Dataset、Dataloader和_DataloaderIter

DatasetPytorch中数据集被抽象为一个抽象类torch.utils.data.Dataset,所有的数据集都应该继承这个类,并override以下两项: - __len__:代表样本数量。len(obj)等价于obj.__len__()。 - __getitem__:返回一条数据或一个样本。obj[index]等价于obj.__getitem__。建议将节奏的图片等高负载的操作放...

2018-08-30 19:16:05 11319 5

原创 Autograd:Pytorch 中的自动微分机制讲解

本文翻译、整理自Autograd官方documentation本文讲解了Autograd——pytorch中用于自动求微分的模块。下面的内容不需全部掌握,但读一下还有有助于加强理解的。在backward的过程中排除一部分子图Tensor的属性requires_grad代表它是否需要求梯度。注意除了这个属性除了可以被显式地设置性之外,还会被一个规则所定义:如果一个Tensor AAA...

2018-08-30 16:43:45 3125

原创 Ubuntu配置GPU版本pytorch环境(含NVIDIA驱动+Cuda+Cudnn)

本文更新于2018年8月概述步骤如下: 1. 安装Ubuntu 2. 安装NVIDIA 显卡驱动 2. 安装NVIDIA Cuda 3. 安装NVIDIA CuDNN 4. 安装GPU版本的PyTorch安装Ubuntu系统版本选择之前pytorch是不支持Windows的,现在貌似是支持了,但我们还是选择Ubuntu。注意Ubuntu的版本要与cuda兼容,...

2018-08-28 19:56:29 34397 4

原创 OpenGL中的异步缓存传输Asynchronous Buffer Transfers

本文介绍在OpenGL中buffer的异步传输,翻译、摘抄自OpenGL Insights Chapter 22。目前更新到第三节,待续(后面还没看懂)Terminology为了后文表述方便,现说明一些要使用术语: 1. GPU被称作device 2. 当调用OpenGL functions,相关命令会放入一个队列队列异步地依次执行,这个队列叫device command queu...

2018-07-24 16:19:13 2329

原创 LearnOpenGL.com笔记

* 本文用作学习learnOpenGL.com的备忘1. Hello TriangleRendering pipeline(蓝色部分可编写shader程序): some primitives: GL_LINES: Vertices 0 和1 是一条线,Vertices 2 and 3 是一条线,依次类推。GL_LINE_STRIP: 所有相邻点组成一条线。GL_LINE_LOO...

2018-06-12 15:35:54 682

原创 线性代数及其应用笔记

线代最近好多地方都要用到,然而之前学的太渣啦,这次复yu习xi一遍记一下,方便之后查阅~第1章 线性代数中的线性方程组线性方程组等价⇔⇔\Leftrightarrow解集相同⇔⇔\Leftrightarrow增广矩阵行等价线性方程组的解:null/one/infinite线性方程组相容:有解(one/infinite)行初等变换: 倍加:加上另一行的倍数对换:两行互换倍乘:一...

2018-05-27 01:00:21 7379

原创 [kuangbin带你飞]专题十六A-K KMP & 扩展KMP & Manacher 题目分析

[kuangbin带你飞]专题十六 KMP & 扩展KMP & Manacher 题目分析,含源码

2017-11-13 02:03:15 445

原创 国内外常用OJ介绍

国内外常用OJ

2017-11-07 13:12:34 9624 1

原创 从零开始了解JavaScript

JS简介

2017-11-01 02:14:07 393

原创 简单四步安装Windows10+Ubuntu双系统教程

简单4步安装Windows10+Ubuntu双系统

2017-10-31 05:29:22 992

原创 英文Windows 10中的中文显示不正常问题解决方案

英文Windows 10中的中文显示不正常问题解决方案

2017-10-31 02:33:14 15086 2

原创 Sublime Text 3安装SublimeCodeIntel并配置JavaScript自动补全

Sublime Text 3安装SublimeCodeIntel并配置JavaScript自动补全

2017-10-30 23:04:27 4090 1

原创 Sublime Text 3安装Package Control

Sublime Text 3第一步,安装Package Control

2017-10-30 20:55:10 261

原创 JSON入门详解

JavaScript入门经典第5版-第八章-JSON简介

2017-10-29 15:11:01 720

原创 [贪心] cf883K Road Widening

c883K road widening题解

2017-10-22 10:34:13 890

原创 [二分][dp] cf883I Photo Processing

ACM cf883I题解

2017-10-22 10:04:09 956

原创 CS231n Convolutional Neural Networks for Visual Recognition

CS231n CNN图像分类 笔记

2017-10-19 23:33:25 394

原创 模拟的操作系统nachos解读

对一个模拟的操作系统nachos解读,对理解操作系统很有帮助

2017-10-17 19:05:44 968

原创 CNN入门paper

CNN入门的paper

2017-10-16 19:28:22 974

原创 微积分-刘建亚笔记

高数笔记,各领域可能需要高数知识储备

2017-10-15 10:58:24 1000

原创 Introduction to D3

D3入门

2017-09-26 21:48:53 270

原创 深度学习 21天实战caffe 前三天 笔记

深度学习 caffe笔记

2017-09-26 07:46:44 2293

原创 李宏毅机器学习 10.卷积神经网络 笔记

李宏毅机器学习-10.卷积神经网络使用CNN处理图像的原因:性质一:Some patterns are much smaller than the whole image(如鸟的图像中有鸟嘴这个小pattern). A neuron does not have to see the whole image to discover the pattern. Connecting to small r

2017-09-26 07:28:27 1823

原创 机器学习-周志华-第五章笔记 CNN

Chapter 5 神经网络-机器学习-周志华5.1神经元模型神经网络:具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。神经元模型:一个神经元收到的刺激超过阈值(threshold/bias),它就会被激活。概括为M-P神经元模型:n个带权输入→\rightarrow与threshold比较→\rightarrow激活函数处理产生输出。

2017-09-26 07:22:38 1519

原创 [dp]cf gym 101485B; bzoj4426 Better Productivity(NWERC 2015 B)

dp题目

2017-09-20 10:29:18 830

原创 OpenCV环境搭建及简单示例

opencv入门

2017-09-15 08:45:34 567

原创 [树形dp][trie]cf856B Similar Words

@(ACM题目)[字符串, 图论, trie, 染色]Description Let us call a non-empty sequence of lowercase English letters a word. Prefix of a word x is a word y that can be obtained from x by removing zero or more last l

2017-09-13 07:20:28 633

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除