自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(222)
  • 资源 (9)
  • 收藏
  • 关注

原创 电子书

1. 信号处理(1)Detection of Signals in Noise (2nd Edition)Author(s): McDonough, Robert N.; Whalen, Anthony D.Publisher: ElsevierYear: 1995ISBN: 978-0-12-744852-7,978-0-08-050408-7链接: https://pan.baidu.com/s/1OmB-TGlkXJGzCNWZV2pwQw

2020-12-17 11:44:11 331 2

转载 目标检测最新方法介绍

https://handong1587.github.io/deep_learning/2015/10/09/nlp.htmlJump to...LeaderboardPapersR-CNNMultiBoxSPP-NetDeepID-NetNoCFast R-CNNDeepBoxMR-CNNFaster R-CNNYOLOAttentionNetDenseB

2017-01-01 19:11:38 25200

原创 理解FFT(一):为什么用正弦函数进行傅立叶变换

根据线性代数的基本知识Ax=λx , x就是特征向量,λ是特征值,信号A乘以x,只改变了λ大小,而方向没有变化。线性时不变系统LTI的特征向量是e^jwt(1),根据欧拉公式,e^jwt=coswt+jsinwt,从中可以看出,线性时不变系统的特征向量就是正弦(余弦只是正弦改变相位)波,当系统输入正弦波,输出也是正弦波,只是乘了个幅值,这样便以计算。参考链接: (1)https://www.zhi

2016-12-27 10:40:25 8749

原创 打破砂锅理解深度学习(一):引言

最近开始转到深度学习上研发交通标志识别的项目,虽然用开源框架能够训练出识别率比较好的分类模型,但有很多问题不明白,所以准备写个博客专题,自负压力,自问自答,与大家一起交流学习。        该专题计划用问答式的方式记录研发过程中遇到的问题,用打破砂锅问到底的精神挖掘深度学习知识,力求能够让一个具有高中或初中知识的同学能够理解深度学习是什么 ?深度学习由来是什么?能做什么?如何做的?与其他机器

2016-10-12 11:07:15 1073

转载 【转】数据挖掘系列(10)——卷积神经网络算法的一个实现

前言  从理解卷积神经到实现它,前后花了一个月时间,现在也还有一些地方没有理解透彻,CNN还是有一定难度的,不是看哪个的博客和一两篇论文就明白了,主要还是靠自己去专研,阅读推荐列表在末尾的参考文献。目前实现的CNN在MINIT数据集上效果还不错,但是还有一些bug,因为最近比较忙,先把之前做的总结一下,以后再继续优化。  卷积神经网络CNN是Deep Learning的一个重要算法,在很多

2016-05-31 09:19:50 1249

原创 双边滤波的白话理解

双边滤波就是在对像素进行卷积时,不单单用位置(定义域)信息,还要用到值域信息。你看看高斯卷积的模板,就能明白什么是位置信息。值域信息就是当前像素与邻域像素的差别,差别越大(也就是边界位置),权重越小,这个小权重施加到高斯模板上,就会让高斯权重变小,模糊变弱,也就起到了在边界处弱化高斯模糊的作用,双边滤波的保边作用就是这样实现的。而在平坦区域,值域与领域像素差别小,几乎为零(指数函数用到了),那么权

2016-02-18 17:59:27 3891

原创 为什么高斯分布的函数要这样写?

上面的公式是标准正态公布的密度函数,但为什么公式要这样写?下面是相关原因:也就是说,公式这样写可以保证积分为1,那么为什么用e指数函数?下面是e指数函数图像:e指数函数图像特征:过点(0,1),过第二、第一象限。定义域是R,值域是f(x)>0在定义域内f(x)是随着x的增大而增大。当x -> -∞ 时f(x)=0当x -> +∞ 时f(x)=+∞

2016-01-28 18:18:32 1698

转载 如何理解线性代数

大概解决我学线代开始的基本上所有的困惑。。。前不久chensh出于不可告人的目的,要充当老师,教别人线性代数。于是我被揪住就线性代数中一些务虚性的问题与他讨论了几次。很明显,chensh觉得,要让自己在讲线性代数的时候不被那位强势的学生认为是神经病,还是比较难的事情。可怜的chensh,谁让你趟这个地雷阵?!色令智昏啊!线性代数课程,无论你从行列式入手还是直接从矩阵入手,从

2016-01-23 09:50:24 1026

转载 OpenCV在未知相机内参数情况下的立体图像矫正方法及注意事项

很多时候我们不知道摄像机的内参数矩阵,并且我们也不太关注内参数到底是多少,因为我们仅仅关心如何得到两幅图像的稠密匹配,或者两幅图像的差别——例如我们只想计算两幅图像的视差图,或者说得到两幅立体图像对的深度图就足够了。既然不知道摄像机的内参数,那么就只能借助对极约束来达到目的了。通过计算两幅图像的基础矩阵F,然后利用对极约束矫正极线为平行线的方法,可以很好的实现这个目标,该方法也被称为Hartly方

2016-01-12 11:43:05 2112 1

转载 特征向量的几何意义

特征向量确实有很明确的几何意义,矩阵(既然讨论特征向量的问题,当然是方阵,这里不讨论广义特征向量的概念,就是一般的特征向量)乘以一个向量的结果仍 是同维数的一个向量,因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一个向量,那么变换的效果是什么呢?这当然与方阵的构造有密切关系,比如可 以取适当的二维方阵,使得这个变换的效果就是将平面上的二维向量逆时针旋转30度,这时我们可以问一个问题,有没有

2016-01-07 09:40:00 1138

转载 旋转矩阵(Rotate Matrix)的性质分析

学过矩阵理论或者线性代数的肯定知道正交矩阵(orthogonal matrix)是一个非常好的矩阵,为什么这么说?原因有一下几点:正交矩阵每一列都是单位矩阵,并且两两正交。最简单的正交矩阵就是单位阵。正交矩阵的逆(inverse)等于正交矩阵的转置(transpose)。同时可以推论出正交矩阵的行列式的值肯定为正负1的。正交矩阵满足很多矩阵性质,比如可以相似于对角矩阵等等。  以上

2015-11-10 16:00:52 81861 3

转载 摄像机矩阵详解

之前学习摄像机模型的时候弄得不是太清楚,现在记录一下。1.摄像机矩阵的分解摄像机矩阵可以表示为如下形式:P=[M|−MC](1)其中,C为摄像机在世界坐标系中的位置,求出摄像机的位置C只需要用−M−1乘以摄像机矩阵最后一列。对摄像机矩阵进一步分解可得:P=K[R|−RC]=K[R|T](2)矩阵R是rotation矩阵,因此是正交的;K是上三

2015-11-02 16:37:08 12572 1

转载 [转]C语言math.h库函数中atan与atan2的区别

今天做图像旋转练习的时候,要根据鼠标的移动轨迹来确定转过的角度,于是就很自然的想到通过三个点来确定这个转过的角度:图像的中心,鼠标按下的点,鼠标拖到的点。想到使用斜率来计算角度,于是联想到数学公式中的arctan反正切函数,通过搜索得知在math.h函数库中有2个函数:atan与atan2都可以求到角度,我最初使用的是atan函数,可是在使用的过程中,出现了很大的问题。1.atan()接受

2015-10-28 11:51:54 3755

转载 高等数学体系结构

说实话,知道这些没有任何用处。难不难也看个人的喜欢和思维习惯,有的人学代数就是很难但学分析会觉得简单,有的人又正好相反。简单地说一下;数学中有“三低三高”之说,也就是指分析、代数和几何三个分支,其中三低是指大学的基础课程,分析主要指数学分析(包括实数理论、微积分理论、级数理论、微分方程等),代数主要指高等代数(包括多项式理论、矩阵理论、向量空间、线性空间等),几何主要指空间解析几何(包括投影几何、

2015-09-30 08:57:41 7181

转载 华山论剑----常用角点检测与角点匹配方法比较

最近这些日子,我在中科院实习了一段时间,收获了很多宝贵的知识和经验,也认识了一些朋友,在这里感谢老师们对我的指导和建议。作为一名图像处理专业的数学Geek,我很喜欢做关于图像方面的算法研究,在这里把近几年的角点特征匹配方法做个总结,和大家分享一下。  图像匹配能够应用的场合非常多,如目标跟踪,检测,识别,图像拼接等,而图像匹配最核心的技术就要属角点匹配了,所谓角点匹配是指寻找两幅图像之间的特征

2015-09-09 14:48:20 2108 1

转载 本质矩阵和基础矩阵的区别是什么

先了解下对极几何,两个相机在不同位置(实际要求光心位置不同即可)拍摄两张图,这个模型就是对极几何,如下图(摘自《计算机视觉中的多视图几何》):两摄像机光心分别是C和C',图像平面是两白色的平面,空间中某一个点X在两张图的投影点分别是x和x'。这样的模型就是对极几何,空间点和两光心组成的平面叫做对极面。简言之,不同视点拍摄的两个场景满足对极几何关系。再讲下基本矩阵,存在这么一个矩阵F

2015-09-09 14:28:02 2949

转载 比较 KAZE 与 SIFT 的算法

根据测试结果,两种算法对于ubc、bikes、trees和boat四种图集都有很好的鲁棒性,能够准确将图像匹配起来。两种算法的差异主要是在bark、graf、leuven和wall图集中表现出来的。方法/步骤1bark图集主要检验特征算法对旋转和缩放的鲁棒性。可见KAZE算法有效检测的特征点少于SIFT算法,而SIFT算法则能成功匹配所有

2015-09-09 14:15:23 4160

转载 齐次坐标的理解

一直对齐次坐标这个概念的理解不够彻底,只见大部分的书中说道“齐次坐标在仿射变换中非常的方便”,然后就没有了后文,今天在一个叫做“三百年 重生”的博客上看到一篇关于透视投影变换的探讨的文章,其中有对齐次坐标有非常精辟的说明,特别是针对这样一句话进行了有力的证明:“齐次坐标表示是计算机图形学的重要手段之一,它既能够用来明确区分向量和点,同时也更易用于进行仿射(线性)几何变换。”—— F.S. Hill

2015-09-09 13:43:49 906

转载 OpenCV中特征点提取和匹配的通用方法

OpenCV在新版本中把很多C语言的代码都重新整理成了C++代码,让我们在使用的时候更加方便灵活。其中对于特征点的提取和匹配,充分体现了C++的强大。下面直接用例子来说明。假设我们有两幅图:1.bmp和2.bmp,要从中提取体征点并匹配,代码如下: // Load image from fileIplImage *pLeftImage = cvLoadImage("1.bmp", CV

2015-09-09 13:35:32 2498 1

转载 调试方法

计算机组成原理→DOS命令→汇编语言→C语言(不包括C++)、代码书写规范→数据结构、编译原理、操作系统→计算机网络、数据库原理、正则表达式→其它语言(包括C++)、架构……对学习编程者的忠告:眼过千遍不如手过一遍!书看千行不如手敲一行!手敲千行不如单步一行!单步源代码千行不如单步对应汇编一行!单步类的实例“构造”或“复制”或“作为函数参数”或“作为函数返回

2015-08-28 09:41:17 616

转载 计算机视觉整理库

本文章有转载自其它博文,也有自己发现的新库添加进来的,如果发现有新的库,可以推荐我加进来转自:http://www.cnblogs.com/tornadomeet/archive/2012/05/24/2515980.html              http://www.cnblogs.com/mothe123/p/4267248.html   Deep Learnin

2015-08-25 11:59:21 4535

原创 常用投影及转换介绍

Transformations and projectionsIn what follows are various transformations and projections, mostly as they apply to computer graphics.Spherical Projections (Stereographic and Cylin

2015-08-18 16:37:11 11176 1

转载 再议gluPerspective和gluLookAt的关系

看了Opengl的相关程序,发现有些东西还是特别迷茫,尤其是gluLookAt的函数做啥用的,而gluPerspective又有什么功能.在网上查看到了这篇: 终于搞明白gluPerspective和gluLookAt的关系了(zz)http://cowboy.1988.blog.163.com/blog/static/751057982010101574732212/我感

2015-08-12 11:28:06 832

转载 计算机视觉基础1——视差与深度信息

资料来源:Robert Collins,CSE486, Penn State第8讲Stereo Vision深度信息感知是人类产生立体视觉的前提。生理过程一定是相当复杂,此处,我们只从物理角度,并采用数学的方法来讨论。Inferring depth from images taken at the same time by two or more cameras. 基本透视投影

2014-12-09 18:11:42 27155 3

转载 My deep learning reading list

主要是顺着Bengio的PAMI review的文章找出来的。包括几本综述文章,将近100篇论文,各位山头们的Presentation。全部都可以在google上找到。BTW:由于我对视觉尤其是检测识别比较感兴趣,所以关于DL的应用主要都是跟Vision相关的。在其他方面比如语音或者NLP,很少或者几乎没有。个人非常看好CNN和Sparse Autoencoder,这个list也反映了我的偏好

2014-11-16 18:12:03 1846

转载 GLUT的一个简明OO封装

毕业设计用到了OpenGL,由于不会用MFC和Win32API做窗口程序;自然选用了GLUT。GLUT很好用,就是每次写一堆Init,注册callback,觉得有点恶心,于是对他做了简单的OO封装。记录在此,如有同学有兴趣可以下载。GLUT应用程序直接使用GLUT的程序是这样的:#include #include void display() {// OpenGL c

2014-09-26 22:46:37 1102

转载 What are the best talks/lectures related to big data/algorithms/machine learning?

Franck Dernoncourt, PhD student in AI @ MIT435 upvotes by Chris Hammerschmidt, Helen Flynn, Fahira Afzal, (more)Here are the 100 most popular Machine Learning talks athtt

2014-09-10 05:09:23 1954

转载 如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧(一)

我保证这篇文章和你以前看过的所有文章都不同,这是12年还在果壳的时候写的,但是当时没有来得及写完就出国了……于是拖了两年,嗯,我是拖延症患者……这篇文章的核心思想就是:要让读者在不看任何数学公式的情况下理解傅里叶分析。傅里叶分析不仅仅是一个数学工具,更是一种可以彻底颠覆一个人以前世界观的思维模式。但不幸的是,傅里叶分析的公式看起来太复杂了,所以很多大一新生上来就懵圈并从此对

2014-05-29 19:17:20 4276 1

转载 如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧(二)

上一篇文章发出来之后,为了掐死我,大家真是很下工夫啊,有拿给姐姐看的,有拿给妹妹看的,还有拿给女朋友看的,就是为了听到一句“完全看不懂啊”。幸亏我留了个心眼,不然就真的像标题配图那样了。我的文章题目是,如果看了这篇文章你“还”不懂就过来掐死我,潜台词就是在你学了,但是没学明白的情况下看了还是不懂,才过来掐死我。另外,想跟很多人抱歉,因为评论太多了,时间有限,不能给每个人回复,还望大家谅解。但是

2014-05-29 19:14:51 2359

转载 [转]牛人blog

[置顶] 牛人blog分类: 乐在科研中2010-10-15 15:15 1240人阅读 评论(0) 收藏 举报matlabresources算法filterimage这个是个牛人关于计算机视觉方面。。。做的非常好。。。Reproducible research in computational science:  http://www.csee.wvu.edu

2014-05-08 11:41:22 780

原创 图像融合在图像清晰化中的应用

源图像1 源图像2 源图像3 源图像4 融合结果图像算法思想:针对过饱和和欠饱和图像造成的视觉缺失,过饱和部分细节丢失,欠饱和部分细节也丢失,针对相同角度的多张图片(过饱和和欠饱和同时存在),通过图像融合的方法,即在多张图像中,把有细节的部分保留到结果图像中,没有细节部分舍去则会生成曝光均匀的图像。

2014-05-07 15:38:03 2865 2

原创 C#调用c++的dll,结构体数组作为引用参数的传递方式

1.C#代码:(1)            LEAK_RECT[] leak_rects = new LEAK_RECT[20];            int leak_num=0;            //画框最好还是漏水用红框,裂缝用绿框,与我生成的文件保持一致            byte bDetect = Leak_Crack_Detect(m_FileName

2014-04-07 16:36:58 8206 1

原创 .exe中触发一个断点,堆损坏

在属性页中把"MFC的使用"由“在静态库中使用MFC”改为"在共享 DLL 中使用 MFC"。参考:http://www.cnblogs.com/mysunnyday/archive/2011/08/06/2129327.html

2014-03-12 15:51:13 2032

转载 [转载]压缩跟踪Compressive Tracking综述

感谢香港理工大学的Kaihua Zhang,这是他即将在ECCV 2012上出现的paper:Real-time Compressive Tracking。 这里是他的介绍:一种简单高效地基于压缩感知的跟踪算法。首先利用符合压缩感知RIP条件的随机感知矩对多尺度图像特征进行降维,然后在降维后的特征上采用简单的朴素贝叶斯分类器进行分类。该跟踪算法非常简单,但是实验结果很鲁棒,速度大概

2014-02-22 20:27:18 4775

转载 为什么要进行傅立叶变换,究竟有何意义?如何用MATLAB实现快速傅立叶变换?

说明:电类专业的同学,请务必认真读完,FFT必将对你以后的工作和研究起到深远的意义!(此贴转载整理于网络 )写在最前面:本文是我阅读了多篇相关文章后对它们进行分析重组整合而得,绝大部分内容非我所原创。在此向多位原创作者致敬!!!一、傅立叶变换的由来 关于傅立叶变换,无论是书本还是在网上可以很容易找到关于傅立叶变换的描述,但是大都是些故弄玄虚的文章,太过抽象,尽是

2014-02-08 09:49:27 2040

转载 [转]openmp的一点使用经验

最近在看多核编程。简单来说,由于现在电脑CPU一般都有两个核,4核与8核的CPU也逐渐走入了寻常百姓家,传统的单线程编程方式难以发挥多核CPU的强大功能,于是多核编程应运而生。按照我的理解,多核编程可以认为是对多线程编程做了一定程度的抽象,提供一些简单的API,使得用户不必花费太多精力来了解多线程的底层知识,从而提高编程效率。这两天关注的多核编程的工具包括openMP和TBB。按照目前网上的讨论,

2014-01-18 15:32:59 936

转载 【转载】再谈OpenCV数据结构Mat详解

我记得开始接触OpenCV就是因为一个算法里面需要2维动态数组,那时候看core这部分也算是走马观花吧,随着使用的增多,对Mat这个结构越来越喜爱,也觉得有必要温故而知新,于是这次再看看Mat。Mat最大的优势跟STL很相似,都是对内存进行动态的管理,不需要之前用户手动的管理内存,对于一些大型的开发,有时候投入的lpImage内存管理的时间甚至比关注算法实现的时间还要多,这显然是不合适的。除了

2013-12-22 20:34:18 986

转载 OpenCV矩阵结构CvMat初探

摘自:http://blog.csdn.net/chenli2010/article/details/67815361. 理解CvMat结构的数据类型 新建二维矩阵:cvMat* cvCreateMat(int rows, int cols,int type);其中type可以是任何预定义类型,其结构为:CV_(S|U|F)C,bit_depth表示存储一个数字所需要的

2013-12-22 20:30:09 874

转载 堆和栈的区别

非本人作也!因非常经典,所以收归旗下,与众人阅之!原作者不祥!堆和栈的区别一、预备知识—程序的内存分配一个由c/C++编译的程序占用的内存分为以下几个部分1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。注意它与数据

2013-12-17 10:38:37 961

转载 图像处理与计算机视觉:基础,经典以及最近发展

历时一个多月,终于用业余时间把这些资料整理出来了。以后可能会有些小修小补,但不会有太大的变化了。万里长征走完了第一步,剩下的就是理解和消化了。借新浪ishare共享出来,希望能够对你的科研也有一定的帮助。现在已经把所有的文章打包,分成了16个子文件,欢迎整体下载。图像处理与计算机视觉:基础,经典以及最近发展(1)序图像处理与计算机视觉:基础,经典以及最近发展(2)图像处理与计算机视

2013-11-06 09:43:21 1943

How to Install Google Chrome In A Different Drive In Windows Digitechind.pdf

将chrome安装到其他硬盘,解决吃C盘空间的问题,亲测可用,就是英文的,已将Chrome安装到D盘,不再吃C盘空间。将chrome安装到其他硬盘,解决吃C盘空间的问题,亲测可用,就是英文的,已将Chrome安装到D盘,不再吃C盘空间。将chrome安装到其他硬盘,解决吃C盘空间的问题,亲测可用,就是英文的,已将Chrome安装到D盘,不再吃C盘空间。

2020-01-03

牛津3000核心词汇表注释加音标1-4 完整版 .pdf

牛津3000核心词汇表注释加音标 牛津3000核心词汇表注释加音标

2019-08-23

GTK2.2.4 all in on bundle

GTK+ 是一种函数库是用来帮助制作图形交互界面的。Windows(32-bit)版本,当前是Version 2.24,是all-in-one bundle.下载下来是一个zip压缩包,里面有一个txt说明。把压缩包解压到一个空目录下,比如我放在C:\Program Files (x86)\GTK 下,然后将bin的路径添加进系统环境变量PATH中。之后按说明验证,Win+R输入cmd运行,在cmd中输入“pkg-config --cflags gtk+-2.0” ,会有一些输出,输入 “gtk-demo” ,会出现一个示例,演示GTK+的一些功能控件。

2015-12-01

Opencv_detailed拼接工程

opencv的detailed拼接工程文件,便于详细研究opencv的拼接流程。

2015-09-30

OpenSift for vs2013

opensift是个特征点检测库,源码是用在unix上,现在这版已移植到win7平台下的vs2013中,经过我们实测可用。

2015-09-28

8点法求基础矩阵

求基础矩阵的经典论文,8点法,欢迎下载。

2015-09-09

mxArray,IplImage,CvMat转换类

opencv与matlab混合编程用到的mxArray,IplImage,CvMat转换类。

2012-08-17

opencv1.1的dll打包下载

opencv1.1 的dll库,便于大家开发使用。

2012-05-23

《visual c++matlab图像处理与识别实用案例精选》源码

《visual c++matlab图像处理与识别实用案例精选》源码

2009-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除