- 博客(21)
- 资源 (16)
- 收藏
- 关注
原创 用Python实现一个简易的“听歌识曲”demo(一)
0. 背景 最近两年,“听歌识曲”这个应用在国内众多的音乐类APP火热上线,比如网易云音乐,QQ音乐。用户可以通过这个功能识别当前环境里正在播放的歌曲名字,听起来很酷。其实“听歌识曲”这个想法最早是由一家叫Shazam的国外公司提出的。 - 2008年,Shazam率先在ios和android上发布了APP,并且整合了iTunes/Amazon’s MP3 store歌曲购买服务; ...
2018-09-09 17:22:10 16538 32
原创 漫谈autoencoder:降噪自编码器/稀疏自编码器/栈式自编码器(含tensorflow实现)
在非监督学习中,最典型的一类神经网络莫过于autoencoder(自编码器),它的目的是基于输入的unlabeled数据X={x(1),x(2),x(3),...}X={x(1),x(2),x(3),...},通过训练得到数据的一个降维特征表达H={h(1),h(2),h(3),...}H={h(1),h(2),h(3),...}。
2018-08-11 20:45:14 63149 52
原创 OpenCV机器学习:Android上利用SVM实现手写体数字识别
这篇博客是之前那篇在win7上用OpenCV的SVM分类器做[MNIST手写数字识别](https://blog.csdn.net/wblgers1234/article/details/73477860)的后续。用MNIST数据集做SVM训练和测试的细节可以移步那篇博客进行了解。
2018-05-08 21:43:22 5564 6
原创 OpenCV在Android上实现人脸背景虚化
自己也想动手做一个“图像虚化”的Demo来玩玩,当然并不是用的手机的双摄原理,而是用一些图像处理的算法。比如说高斯模糊,博主阮一峰的这篇博客对“高斯模糊在图像处理中的应用”讲得非常详细,大家可以移步去看
2017-09-04 23:02:41 5536
原创 Python实现基于BIC的语音对话分割(二)
1. 语音多分割点检测在上一篇博客<Python实现基于BIC的语音对话分割(一)>中,我们介绍了基于BIC(贝叶斯信息准则)的语音分割问题,有一个假设是这段语音中只有一个分割点,即语音对应的特征服从下面的分布: 模型H1:x1...xi∼N(μ1,Σ1);xi+1...xN∼N(μ2,Σ2)模型H_1: x_1...x_i \sim \mathcal{N}(\mu_1,\Sigma_1) ;
2017-08-13 12:23:19 12533 29
原创 VS2015+OpenCV-2.4.10配置AR(增强现实)开发环境
1. 编译OpenCV-2.4.101.1 安装DependencyCMAKE 下载地址为https://cmake.org/download/ 推荐下载cmake-3.9.0-win64-x64.zip,解压即可。OpenCV-2.4.10 source code https://sourceforge.net/projects/opencvlibrary/files/opencv-un
2017-08-07 11:37:51 5348
原创 Python实现基于BIC的语音对话分割(一)
1. 贝叶斯信息准则在统计学里,处理模型选择问题时我们往往采用BIC进行判定,即贝叶斯信息准则。BIC是似然函数(likelihood function)加上一个惩罚项组成的,这个加上的惩罚项与模型拟合的参数有关,这样可以防止过拟合。一般来说,贝叶斯信息准测的定义如下所示: BIC=ln(n)k−2ln(L^)BIC = ln(n)k-2ln(\hat{L})
2017-07-23 22:40:10 13011 9
原创 用PyTorch实现一个卷积神经网络进行图像分类
1. 回顾在进入这一篇博客的内容之前,我们先确保已经成功安装好PyTorch,可以参考我之前的一篇博客“Ubuntu12.04下PyTorch详细安装记录”:http://blog.csdn.net/wblgers1234/article/details/72902016接下来,我们用设计一个简单的卷积神经网络的方式来熟悉PyTorch的用法。
2017-07-18 21:27:13 10469 1
原创 卷积神经网络Step by Step(五)
来到卷积神经网络详解的最后一章,在前面四篇博客里,我们首先对CNN的整体框架进行讲解,然后结合代码对卷积层、池化处理、全连接网络层以及计算cost的前向传播,计算梯度值的反向传播都分别进行讲解。这一章,我们要把这些全部捏合起来,构建一个CNN神经网络,并在MNIST数据集上进行分类训练和测试。
2017-07-10 22:41:15 2741
原创 Android Studio配置并运行OpenCV4Android的face-detection
0. 开发环境之前一直是用ADT bundle自带的Eclipse来做OpenCV4Android的开发,其实AS(Android Studio)经过几年的发展已经逐渐完善,对Android开发的支持也好过Eclipse,所以痛下决心,这一次就花点时间把OpenCV4Android在AS中配置好。
2017-07-08 20:43:00 5331
原创 OpenCV机器学习:SVM分类器实现MNIST手写数字识别
0. 开发环境最近机器学习随着AI人工智能的兴起越来越火,博主想找一些ML的库来练手。突然想起之前在看Opencv的doc时发现有ML的component,于是心血来潮就开始写代码试试。话不多说,直接进正题。以下我的开发环境配置: -Windows7 -Visual Studio2015 -OpenCV3.21. MNIST手写数据库我们选用鼎鼎大名的MNIST手写库作为...
2017-06-19 22:39:58 14306 31
原创 卷积神经网络Step by Step(四)
卷积神经网络Step by Step(四)系列的第一篇博客对卷积神经网络的几个重要概念进行总结,现在就从代码的角度对”卷积”,”池化”,”反向传播”进行详细的分析。代码是基于“UFLDL Tutorial”的excercise代码中的cnn部分实现的,系列博客的最后我会把代码的Github地址分享出来。
2017-06-15 11:28:08 2860
原创 Ubuntu12.04下PyTorch详细安装记录
Pytorch简介1.PyTorch安装目前来说Pytorch只支持Linux和OSX两个平台,所以我选择Ubuntu来进行PyTorch的安装和使用。
2017-06-07 17:17:46 6573
原创 Pthreads多线程实战之“桶排序”
1. 前言桶排序的主要思想是分而治之,是将待排序数组里的所有元素分放至不同的桶形容器里,然后在每个桶容器里分别进行排序(可以用其他排序算法,如插入排序,冒泡排序等),也可以通过递归实现桶排序来实现。最后再把每个桶容器里面有序的元素整合在一起完成最终的排序。
2017-06-03 20:45:20 2915
翻译 Pthreads多线程编程(3)
互斥量1. 概述Mutex是"mutual exclusion"的缩写,互斥量是完成线程同步和在并发操作中保护共享数据的一种主要方法。互斥量在保护共享数据资源时的行为类似于"锁"。在多线程中,任何时候只有一个线程可以持有互斥量。因此,即使有多个线程尝试去持有某个互斥量,只有一个线程可以成功。多个线程必须轮流访问被保护的共享数据。互斥量可以用来避免竞争条件。下图是一个涉
2017-05-31 14:39:53 2316
翻译 Pthreads多线程编程(2)
在VS2010中配置Pthreads-win32 http://web.cs.du.edu/~sturtevant/pthread.html本系列的学习笔记是参考的https://computing.llnl.gov/tutorials/pthreads/#Designing三 Pthreads API介绍组成Pthreads API的库函数按照功能可以分为以下四大类:
2017-05-31 14:31:06 2888
原创 卷积神经网络Step by Step(三)
卷积神经网络Step by Step(三) 系列的第一篇博客(一)对卷积神经网络的几个重要概念进行总结,现在就从代码的角度对”卷积”,”池化”,”反向传播”进行详细的分析。
2017-05-28 22:25:28 2385
原创 卷积神经网络Step by Step(二)
卷积神经网络Step by Step(二) 上一篇博客对卷积神经网络的几个重要概念进行总结,现在就从代码的角度对”卷积”,”池化”,”反向传播”进行详细的分析。代码是基于“UFLDL Tutorial”的excercise代码中的cnn部分实现的,系列博客的最后我会把代码的Github地址分享出来。“卷积”层卷积层的核心实现由函数cnnConvolve.m完成,输入参数中filterDim是指特征
2017-05-10 11:58:37 2526
原创 卷积神经网络Step by Step(一)
卷积神经网络Step by Step(一)这第一篇博客先从理论的角度阐述卷积神经网络的原理,包括卷积特征提取、池化以及误差反向传播。博客的内容是根据对Stanford大学的“UFLDL Tutorial”进行学习,并结合自己的理解所成,欢迎拍砖。1. 用“卷积”进行特征提取利用自然图像中的统计特征不变性,我们可以对图像的某一部分进行特征学习,然后通过卷积处理的形式应用到图像的其他部分做特征激活(fe
2017-04-28 17:37:03 3368
翻译 Pthreads多线程编程(1)
在VS2010中配置Pthreads-win32 http://web.cs.du.edu/~sturtevant/pthread.html本系列的学习笔记是参考的https://computing.llnl.gov/tutorials/pthreads/#Designing一 引言在支持共享内存的多核架构中,线程(thread)可用来实现并行编程。从历史的角度来看pthrea
2014-08-04 20:28:36 2691
原创 基于AR预测模型的来电显示2FSK解调算法仿真
(一) 背景来电显示服务为接听方提供来电者的信息,包括来电时间、日期以及来电者的名字等。这些信息在发送端用ACSII码表示,最终的二进制数据通过数字调制后嵌入在在第一次响铃和第二次响铃之间进行传输。来电显示采用的调制标准是Bell 202 modem标准:· 2FSK调制(二电平频移键控)· 符号率(比特率):1200bit/s· 逻
2014-07-27 21:49:01 3585
Python听歌识曲
2018-09-14
利用OpenCV在android上实现带有人脸背景虚化功能的拍照APP
2017-09-05
利用OpenCV SVM对MNIST手写数据集进行分类
2017-06-20
Representation Learning: A Review and New Perspectives
2017-06-13
Self-taught Learning: Transfer Learning from Unlabeled Data
2017-06-12
PCA算法实现人脸识别(基于matlab GUI界面)
2015-07-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人