自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (4)
  • 收藏
  • 关注

原创 统计学习个人笔记与感悟(一)

写在前面上次更新已经是2年前的事情了,工作了也没时间/没动力去学东西,去更新博客,最近考上信号的博士,还是搞机器学习、图像处理相关专业,所以准备重新开始更博。就我个人而言,博士真的是一个全新的挑战,之前的教育经历和大多数国人一样,按部就班、背诵课本、大量刷题即可,上了研究生发现需要自己去钻研一些东西,老师不会告诉你怎么做,全靠自学,而博士则更是这样,需要在非常窄的问题上,去做出一点点突破,这个不光是导师,全世界估计也没什么人能帮自己,所以还是要踏踏实实去做些东西。这次更新是统计学习笔记,主要写的是一些

2020-08-30 23:12:10 311

原创 opencv3.0训练自己的级联分类器(traincascade),将已经生成的stage.xml合成最终的分类器xml

最近一段在用opencv自带的分类器训练函数训练分类器,遇到了一点问题: 分类器预设的stage=20太深,当训练到第6层时,已经收敛,而由于训练数据非常多,再往下训练非常耗时(已经卡住三天了),因此我就想,如何把目前生成的6层弱分类器连接起来,当做最终的分类器(精度已经达到要求)。然后就查询网络,得到了下面的解决方法:1.直接根据最终分类器.xml的格式要求,将stagei.xml拼接...

2018-08-21 11:10:19 1960

原创 代码Android端加速

一、背景介绍目前在做一个计算机视觉方面的项目,PC端代码速度可以达标,但移植到android端效率大大降低,所以最近在想办法优化android端的算法。由于之前完全没有接触android,所以优化方法只能上网查找,结果是有用的资料非常少,总结下来推荐的方法有以下两种:OpenCL和NEON指令集优化。二、方法操作1.OpenCL优化(GPU)OpenCL就是使用手机的GPU对代码进行优化,由于我们的

2017-12-04 16:29:20 2342

原创 C++中的vector

C++中的vector与matlab中的cell胞体有点像,就是什么类型的数据都可以放入vector中,下面是一些相关知识1.Vector是C++标准模板库中的部分内容,它是一个多功能的,能够操作多种数据结构和算法的模板类和函数库。vector之所以被认为是一个容器,是因为它能够像容器一样存放各种类型的对象,简单地说,vector是一个能够存放任意类型的动态数组,能够增加和压缩数据。(1)创建一个v

2017-07-29 16:12:57 558

原创 OpenCV学习笔记

最近在用opencv库,下面做一些自己的总结,方便将来查阅。0.cv::Mat的内容:flags int dims int rows int cols int data unsigned char* 数据 refcount int* datastart unsigned char* dataend unsigned char*

2017-07-15 15:27:49 1037

原创 利用matlab进行IIR数字滤波器设计

最近处理语音信号用到了数字滤波器,自己稍微做了下总结,上传上来,以备以后不时之需。 下面这两张图片,从滤波器类型选择,具体每步如何进行都记录了个人的一些学习过程,如有不对,欢迎各位大神批评指正。滤波的基本过程个人总结为以下几步: 1.根据个人需求选择合适的滤波器类型。 2.根据通带阻带频率、通带波纹、阻带衰减等参数确定滤波器的阶数和截止频率; 3.根据阶数与截止频率设计滤波器,得到滤波器传递

2017-05-12 17:19:31 7695

原创 Latex如何按自己需求画表格

前一段在写论文,发现latex真的是神器,只要有模板,往里面填东西即可。之前本科时候有用过,但没有涉及自己画表格的问题,下面我们写下自己画表格的心得。latex允许一个单元一个单元的画表格,从左到右,从上到下 每行结尾是\\ 表格内输入文字内容是用 & 画线: \cline{1-2}:1-2列画横线。 短线 \hline:画一整条横线。 长线 合并单元格: \

2017-04-25 16:30:14 2617

原创 C语言中自带头文件(.h)中包含的函数

由于之前没有好好学习过C语言,所以对其自带头文件所包含的内容总是不清楚,每次写代码都是盲目的#include很多.h,现在重新整理一下,发现了不少很好的函数,以方便复习查阅。不完全统计,C语言标准库中的头文件有15个之多,所以我主要介绍常用的这四个头文件stdio.h,string.h,math.h,stdlib.h,以后用到其他的再做补充。下面上干货:1.stdio.h:定义了输入输出函数、类型以

2017-04-25 16:08:10 3796

原创 C语言中动态内存分配

C语言用了蛮久了,最近在写一个dsp的程序,发现动态内存使用这一块还是很欠缺,于是又重新看了看C的书,总结一下。 之前常见的数组或结构体内存分配,其长度必须是固定的常数,如:int a[10]等,当需要申请变长数组时,常规的直接定义就不可以了,如float b[n],其中n为变量(好像C99之后可以这么做)。 那么这个时候就可以使用malloc与calloc函数,申请动态内存了,这两个函数都在s

2017-04-25 15:59:31 699

原创 C语言中一些容易忽视的细节

1.C语言基本知识编译器:将高级语言程序解释成计算机所需的详细的机器语言指令集的程序。(编译器是一个转换的程序)。 Visual Studio等:是一个集成开发环境(Integrated Development Environment, IDE),包含了编译器和一些其他的工具. 代码流程: 源代码(.c) ==> 编译器 ==> 目标代码(.obj) ==> 链接器(加入了库代码与启动代

2017-04-25 15:55:55 914

原创 MATLAB中通过fft计算信号频谱的问题

之前一直在做声音相关的一个项目,其中用到了很多信号频谱的问题,包括fft点数的选取、fft之后画图横纵坐标的问题、fftshift的用法等等。前面因为忙,也没有仔细研究,现在将问题总结如下:1.fft点数的选取。众所周知,fft是快速傅里叶变换,当信号为2的整数幂时效率最高(当然还有基为3,4的fft,用的不多此处不表,下面提到的fft均为基是2的fft)。 而现实生活中的信号往往并不是2的整数幂

2017-02-17 17:43:08 14123 1

原创 卷积神经网络学习笔记

之前也一直用CNN提特征,但也仅仅将其看成一个特征提取器,网络内部结构我也大概知道,但是不太精细,因此今天想要重新学习一下CNN网络的构造与数据流传输的问题,巩固下基础。1.卷积神经网络最重要的两点:传统神经网络层与层之间是全部连接起来的,这样参数就会变得非常多,难以训练,这也是神经网络早早提出缺没有应用于实际应用的原因。后面提出了卷积神经网络的 局部感受野 和 权值共享 成功解决了这个问题。(1)

2017-01-23 09:57:48 1155

原创 Caffe的使用

因为目前大多数深度论文的代码都是基于caffe的(当然也有基于Theano,torch的等),以前也看过一些,但这几天准备研究研究caffe的框架,写个博客记录一下其中遇到的问题以及解决方案。1.网络训练整体过程(1)将数据转换成caffe的格式。 (2)定义网络。 网络.prototxt文件内定义各层的输入输出、类型以及一些参数 (3)配置求解器。 sol

2017-01-20 10:55:23 548

原创 linux基本操作命令

1. 路径问题:a. 可以使用cd命令,cd命令的功能是切换到指定的目录: 命令格式:cd [目录名] 有几个符号作为目录名有特殊的含义: “/”代表根目录、 根目录/home = home目录 “..”代表上一级目录、 “~”代表HOME目录、 “-”代表前一目录 b. 判断当前路径: pwd . 表示用户当前操作

2017-01-19 11:24:35 503

原创 浅谈人工智能,机器学习,计算机视觉之间的关系

计算机视觉相当于是人工智能的大门,如果这个门不打开,就没有办法真的研究真实世界的人工智能。因为视觉信息与听觉触觉相比要重要得多,人的大脑皮层70%的活动都在处理视觉信息,如果没有视觉信息的话,整个人工智 能只是一个空架子,只能做符号推理(下棋,定理证明等)。计算机视觉相当于一个研究领域,有很多问题要研究。而机器学习更像是一个方法和工具。 本身应当叫统计学习,方法都是从概率领域拿来的,但是机器学习

2017-01-16 11:01:35 15336

原创 一些代码合作心得

最近在做一个项目,项目组目前一共4个人,一个负责硬件一个负责软件界面,剩下我和另一个人负责算法实现。项目也做了有半年多了,其中发现了一些问题,也算是一些收获吧,写在这集合大家分享一下。1.任务分配。因为我是学生组这边的组长,因此会有一些任务分配的部分。本以为这是一个很轻松的工作,其实不然。因为要考虑工作量的多少以及时间的分配,你给别人工作分配的多,按时完成不了,大家都不开心;工作分配的少,你自己就要

2017-01-16 10:35:29 1481

原创 语音的线性预测系数(Linear Prediction Coefficient,LPC)

线性预测技术很早(1967年)就已经被应用与语音处理领域,基本概念是:一个语音的采样值可以通过过去若干语音采样值的线性组合来逼近(最小均方误差),能够决定唯一的一组预测系数,而这个预测系数就是题目中的LPC,可以当作是该语音的一个特征。1.优势线性预测最重要的优势在于其可以较为精确的估计语音的参数,而这些极少的参数可以正确的表现语音信号的时域和频域特性。2.基本原理线性预测分析的基本原理是把信号用一

2017-01-06 11:05:42 14683 1

转载 编程方面的一些好书推荐

最近发现了几个不错的关于程序员的书籍推荐博客,下面贴出地址,跟大家分享。 本文转载自:http://blog.csdn.net/shenziheng1/article/details/527141501、《代码大全》 史蒂夫·迈克康奈尔“优秀的编程实践的百科全书,《代码大全》注重个人技术,其中所有东西加起来, 就是我们本能所说的“编写整洁的代码”。这本书有50页在谈论代码布局。” —— Joel

2016-12-12 11:20:33 1399

原创 谱减法(Spectral Subtraction)进行降噪

谱减法是一种利用语音信号的短时平稳特性,从带噪声的语音信号短时谱中减去噪声的短时谱,从而得到纯净语音的频谱。 该方法是针对宽带声音信号去噪的方法,对加性噪声效果比较好。下面是我个人总结的一个流程: 其中谱减部分具体有三种方法: (1)利用幅度谱进行谱减。 (图中④式) (2)利用功率谱进行谱减。 (图中⑤式,alpha取2) (3)alpha-beta法进行改进,可以减少音

2016-12-09 16:38:58 10559 4

原创 加入attention机制的image caption问题

这两年image caption的问题在CV领域非常火,就是输入一张图片,计算机自动输出对这张图片的文本描述。因为这个问题同时牵涉到了CV(Computer Vision)和NLP(Natural Language Processing),也牵涉到了当下非常流行的一些网络:CNN,RNN,LSTM,而本人也也就过一段这个问题,所以写点感悟,也方便以后复习。    image caption这个

2016-11-25 22:25:22 12211 2

原创 斯坦福机器学习公开课#02.梯度下降

由于之前做的东西偏计算机视觉方向,也对机器学习有了一定的认识,但是并没有形成一个系统的知识架构,因此决定看看吴恩达(Andrew NG)老师的斯坦福机器学习公开课。这个公开课对于机器学习领域的人来说应该是无人不晓,应该也是入门必备吧,我可能会挑选其中的部分进行观看,并进行相关记录,写出一些自己的感悟,以便后面复习起来方便查阅。1.监督学习(supervised learning)众所周知,机器学习的

2016-11-08 13:18:28 809

原创 毕业前的计划

人这种生物是有惰性的,当然会有那种天天很有理想、每天想打了鸡血一样的追梦者,但大多数普通人往往都会选择一个令自己舒服的节奏,惰性使然。本人也是,上大学前还是比较自觉,总喜欢把手头的事情尽早干完,好腾出剩下的整块时间放开了玩,但上了大学以后,发现很多事情都不是一时半会可以搞定的,于是就开始学会了拖延,不到最后时刻绝对不干,就算提前做也是草草做上一点,哪怕任务再紧,也变得无所谓(甚至事情越多,越想玩)

2016-10-24 21:27:29 1363

原创 找工作有感(面经,干货)

找工作也持续了一个半月,现在基本也定了下来吧,真的是浑身轻松了一大截,今天来写写感受吧。其实和大多数学生一样,我从一开始找工作是很迷茫、很惧怕的,一是不知道自己喜欢什么,未来想干什么,二是不知道自己的能力能干些什么工作,哪里会要我?带着忐忑和不安的心情,我开始了找工作之旅。第一站是找人内推了网易和阿里,都是图像算法工程师,因为本人编程能力一般,所以只能算法岗。然后就是漫长的等待,突然有一天

2016-10-03 11:41:15 2406 4

原创 C语言中自带的头文件(.h)所包含的函数

由于之前没有好好学习过C语言,所以对其自带头文件所包含的内容总是不清楚,每次写代码都是盲目的#include很多.h,现在重新整理一下,发现了不少很好的函数,以方便复习查阅。不完全统计,C语言标准库中的头文件有15个之多,所以我主要介绍常用的这四个头文件stdio.h,string.h, math.h,stdlib.h,以后用到其他的再做补充。下面上干货:1.:定义了输入输出函数、

2016-07-14 16:08:11 11214

语音信号梅尔倒谱系数(MFCC)计算,matlab代码

本代码实现读入语音信号,提取该信号的梅尔倒谱系数,为后面的声音模板匹配打基础

2016-04-18

杨辉三角形的编码实现及结果截图

逐行打印二项展开式 (〖a+b)〗^n的系数(打印出杨辉三角形)。 提供用户从键盘输入,杨辉三角形的必要数据,并将其显示出来。

2013-01-08

约瑟夫环的实现代码及结果截图

提供用户从键盘输入,Joseph约瑟夫环的必要数据,并显示出列顺序。 以单向循环链表实现该结构。

2013-01-08

霍夫曼编码、译码的实现

提供用户从键盘输入需要编码的文本,程序输出霍夫曼码并解码。 结构体、指针及二叉树的生成、遍历等操作掌握霍夫曼编码/译码的原理。

2013-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除