hang__19-CSDN博客

原创 CTC & 语音基础 & GMM & EM

Connectionist Temporal Classification （CTC）算法解释https://www.jianshu.com/p/0cca89f64987语音中响度，音调与音色的影响因素https://blog.csdn.net/qq_37385726/article/details/89176142GMM模型与EM算法https://blog.csdn.net...

2019-11-06 16:48:32 336

原创经典语音论文

经典语音论文：语音合成，语音识别为主https://github.com/zzw922cn/awesome-speech-recognition-speech-synthesis-papers

2019-11-06 12:50:00 300

转载语音之特征参数提取

https://blog.csdn.net/w_manhong/article/details/78977833线性预测分析（LinearPredictionCoefficients，LPC）感知线性预测系数（PerceptualLinearPredictive，PLP）Tandem特征和Bottleneck特征基于滤波器组的Fbank特征（Filterbank）线性预测...

2019-10-31 16:28:22 418

转载机器学习中的熵、条件熵、相对熵和交叉熵（为何使用交叉熵作为损失函数）

信息熵，条件熵，相对熵，交叉熵的定义与意义：https://blog.csdn.net/u013569304/article/details/82595548数据压缩与信息熵：http://www.ruanyifeng.com/blog/2014/09/information-entropy.html...

2019-08-18 13:56:47 150

转载数据集总结

包含图像语音数据集及项目总结：https://www.jianshu.com/p/d0baf4326ff2各种免费的数据集：https://www.cnblogs.com/genghenggao/p/9625450.html

2019-08-13 13:33:29 548

转载语音基础知识-基本语音知识，声谱图，log梅普图，MFCC，deltas详解

基本语音知识：https://www.cnblogs.com/liaohuiqiang/p/9916352.html语音特征提取基本知识：https://www.cnblogs.com/liaohuiqiang/p/10159429.html动态时间规整DTW(Dynamic Time Warping)介绍：作用：求解两个不同的时间序列的相似度方法https://blog....

2019-08-11 15:34:54 1500

转载语音识别学习日志 2019-7-17 语音识别基础知识准备6 {维特比算法(Viterbi Algorithm)}

HMM 维特比算法(Viterbi Algorithm)详细解释参考:http://www.52nlp.cn/hmm-learn-best-practices-six-viterbi-algorithm-1http://www.52nlp.cn/hmm-learn-best-practices-six-viterbi-algorithm-2http://www.52nlp.cn/hmm-l...

2019-07-17 20:58:56 387

转载语音识别学习日志 2019-7-16 语音识别基础知识准备5 {决策树算法(ID3、 C4.5、 CART)}

决策树算法(ID3、 C4.5、 CART)决策树的定义决策树学习采用的是自顶向下的递归方法，其基本思想是以信息熵为度量构造一颗熵值下降最快的树，到叶子节点处，熵值为0。其具有可读性、分类速度快的优点，是一种有监督学习。决策树呈树形结构，在分类问题中，表示基于特征对实例进行分类的过程。学习时，利用训练数据，根据损失函数最小化的原则建立决策树模型；预测时，对新的数据，利用决策模型进行分类。...

2019-07-16 16:41:01 484

转载语音识别学习日志 2019-7-15 语音识别基础知识准备4 {Baun-Welch算法}

HMM 前向算法(Forward Algorithm)详细解释参考:http://www.52nlp.cn/hmm-learn-best-practices-five-forward-algorithm-1http://www.52nlp.cn/hmm-learn-best-practices-five-forward-algorithm-2http://www.52nlp.cn/hmm...

2019-07-15 20:05:03 267

转载语音识别学习日志 2019-7-14 语音识别基础知识准备3 {Kmean算法分析与HMM(Hidden Markov Model)模型}

Kmean算法聚类算法对于"监督学习"(supervised learning)，其训练样本是带有标记信息的，并且监督学习的目的是：对带有标记的数据集进行模型学习，从而便于对新的样本进行分类。而在“无监督学习”(unsupervised learning)中，训练样本的标记信息是未知的，目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律，为进一步的数据分析提供基础。对于无监督学习，...

2019-07-14 16:46:53 434

转载语音识别学习日志 2019-7-14 语音识别基础知识准备2 {EM算法与混合高斯模型(Gaussian mixture model, GMM)}

https://blog.csdn.net/lin_limin/article/details/81048411会对GMM和EM做详细介绍本文参考：http://www.ituring.com.cn/article/497545(GMM模型)https://blog.csdn.net/xmu_jupiter/article/details/50889023(GMM模型)http:...

2019-07-14 15:18:18 392

原创语音识别学习日志 2019-7-13 语音识别基础知识准备 1{语音基础知识}

线性预测线性预测(linear prediction)根据随机信号过去的p个已知抽样值序列为Sn-1，Sn-2，…Sn-p，预测现时样值Sn的估计值的方法。预测公式是一个线性方程，所以这种预测称为线性预测。声音的构成声音频率决定音调；声音振幅决定大小；声音谐波决定音色。之所以能分辨出不同乐器和不同人，只因为声音中谐波成份不同。音强声音的强度是一个客观的物理量，...

2019-07-13 20:22:19 670

转载 CNN(Convolutional Neural Network) 的基础

卷积神经网络（Convolutional Neural Network，简称CNN），是一种前馈神经网络，人工神经元可以响应周围单元，可以进行大型图像处理。卷积神经网络包括卷积层和池化层。卷积神经网络是受到生物思考方式启发的MLPs（多层感知器），它有着不同的类别层次，并且各层的工作方式和作用也不同。CNN网络结构如图所示，CNN网络工作时，会伴随着卷积并且不断转换着这些卷积。学...

2019-07-10 00:02:01 439

原创机器学习名词解释

1. 损失函数损失函数是用来估量你模型的预测值f(x)与真实值Y的不一致程度，它是一个非负实值函数,通常使用L(Y, f(x))来表示，损失函数越小，模型的鲁棒性就越好。损失函数是经验风险函数的核心部分，也是结构风险函数重要组成部分。经验风险：一个损失函数的函数结构风险：可简单理解为经验风险（一种损失函数的函数）+λ正则化项。模型的结构风险函数包括了经验风险项和正则项，通常可以表示...

2019-07-09 21:21:38 1409

原创 ubuntu 安装 mysql

（1）打开/etc/mysql/debian.cnf文件，在这个文件中有系统默认给我们分配的用户名和密码，通过这个密码就可以直接对mysql进行操作了。但是一般这个密码都比较怪，很长很长。（2）当进入mysql之后修改mysql的密码：这个方法比较好，具体的操作如下用命令：set password for 'root'@'localhost' = password('yourpass');

2017-11-07 19:42:49 290

转载交叉验证

sklearn中的交叉验证（Cross-Validation）sklearn是利用python进行机器学习中一个非常全面和好用的第三方库，用过的都说好。今天主要记录一下sklearn中关于交叉验证的各种用法，主要是对sklearn官方文档 Cross-validation: evaluating estimator performance进行讲解，英文水平好的建议读官方文档，里

2017-11-05 22:03:32 665

转载特征选择

特征选择是特征工程中的重要问题（另一个重要的问题是特征提取），坊间常说：数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。由此可见，特征工程尤其是特征选择在机器学习中占有相当重要的地位。通常而言，特征选择是指选择获得相应模型和算法最好性能的特征集，工程上常用的方法有以下：1. 计算每一个特征与响应变量的相关性：工程上常用的手段有计算皮尔逊系数和互信息系数，皮尔逊系数只能衡量

2017-11-04 21:23:47 1351

转载 MyBatis3.x和Spring3.x的整合

MyBatis3.x和Spring3.x的整合2017/10/021.mybatis和spring整合的思路1.让spring管理SqlSessionFactory2.让spring管理mapper对象和dao使用spring和mybatis整合开发mapper代理及原始dao接口。自动开启事务，自动管理sqlsession3.让spring管理

2017-10-02 09:40:54 1652

转载 MyBatis之查询缓存

MyBatis之查询缓存2017/09/30正如大多数持久层框架一样，MyBatis同样也提供了对查询数据的缓存支持。今后我们要学习的SpringMVC框架属于系统控制层，它也有它的缓存区域，对响应的jsp页面进行缓存；Spring属于系统业务层，它的缓存区域对业务数据进行缓存。而它们三者的缓存区域都存在于用户要访问数据库的中间，当用户向数据库中发送查询请求时，系统会先在它们三者的

2017-09-30 16:59:59 431

转载 MyBatis之使用resultMap实现高级映射

MyBatis之使用resultMap实现高级映射2017/09/30对于数据库中对表的增删改查操作，我们知道增删改都涉及的是单表，而只有查询操作既可以设计到单表操作又可以涉及到多表操作，所以对于输入映射parameterType而言是没有所谓的高级映射的，也就是说高级映射只针对于输出映射(因为高级映射设计到多张表)。前五篇文章我们都只实现了单表中的字段与pojo的映射，而

2017-09-30 16:07:22 871

转载 MyBatis之动态sql

MyBatis之动态sql2017/09/30我们需要知道的是，使用mybatis重点是对sql的灵活解析和处理。在原先的UserMappser.xml中，我们这样查询表中满足条件的记录 :上述语句在表中查询满足username条件的记录，这样写查询语句有一个弊端，就是该语句只能通过username查询数据库。当我们在多条件中查询时，如果不需要usern

2017-09-30 15:37:33 271

转载 MyBatis之优化MyBatis配置文件中的配置

MyBatis之优化MyBatis配置文件中的配置2017/9/30MyBatis配置文件很重要，首先我们来看看MyBatis配置文件中的内容和顺序:文件目录结构如下:1.属性定义可以把一些通用的属性值配置在属性文件中，加载到mybatis运行环境内。例如创建db.properties文件，然后在SqlMapperConfig.xml

2017-09-30 15:11:21 593

转载 MyBatis之输入(parameterType)与输出(resultType、resultMap)映射

MyBatis之输入(parameterType)与输出(resultType、resultMap)映射2017/9/30在MyBatis中，我们通过parameterType完成输入映射(指将值映射到sql语句的占位符中，值的类型与dao层响应方法的参数类型一致)，通过resultType完成输出映射(从数据库中输出，通过dao层的方法查询到的数据输出到pojo对象中)。注意输

2017-09-30 14:52:30 3149 1

转载 MyBatis之Mapper动态代理开发

MyBatis之Mapper动态代理开发2017/9/301.SqlSession的使用范围1.SqlSessionFactoryBuilderSqlSessionFactoryBuilder是以工具类的方式来使用:需要创建sqlSessionFactory时就new一个 SqlSessionFactoryBuilder2.sqlSessionFactory

2017-09-30 10:30:02 513

转载 MyBatis之快速入门

MyBatis之快速入门2017/9/30首先我要明确告诉大家的是MyBatis是一个java持久层框架，以前我们都是用jdbc来将我们的java程序与数据库相连接，而MyBatis是对jdbc的一个封装。1.MyBatis框架的引入我们来看看传统的编程方式中使用jdbc的问题:1.数据库连接频繁的创建和关闭，缺点:浪费数据库的资源，影响操作效率。解决方法:

2017-09-30 09:52:16 371

转载 Spring

Spring————程序员的春天 2017.09.29当客户端向服务器发出请求时，服务器把得到的请求发送给控制器Servlet，而在Servlet中需要创建Service对象来调用业务层相关功能(故说控制器层Servlet依赖于业务层Service),而在Service中又需要创建数据库层DAO对象来对数据库进行操作(故说业务层Service依赖于数据库层DAO)。思考:针对上

2017-09-29 14:54:59 364

转载 Tensorflow报错：AttributeError: 'module' object has no attribute 'scalar_summary'

报错：tf.scalar_summary(l.op.name + ' (raw)', l)AttributeError: 'module' object has no attribute 'scalar_summary'解决：tf.scalar_summary('images', images)改为：tf.summary.scalar('images', images)tf

2017-09-22 12:42:50 2329

原创 cross-entropy函数

我们理想情况是让神经网络学习更快假设简单模型: 只有一个输入,一个神经元,一个输出简单模型: 输入为1时, 输出为0初始 w = 0.6, b = 0.9 初始预测的输出 a = 0.82, 需要学习学习率: 0.15演示: 初始: w = 2.0, b = 2.0, 初始预测输出: 0

2017-09-11 20:35:35 415

原创手写数字识别

人脑识别图像：人脑: 大脑视觉皮层V1, 包含140,000,000神经元; 数百亿个连接, 还有V2,V3,V4,V5 人脑进化几千年计算机识别图像：神经元：输入00, (−2)∗0+(−2)∗0+3=3, 输出1输入11,

2017-09-04 18:29:41 7590

原创常用软件包和环境配置（机器学习）

1. 常用软件包：TheanoPylearn2scikit-neuralnetworkCaffeDeeplearning4jTorchhttp://deeplearning.net/software_links/2. 环境配置Linux: UbuntuEclips

2017-09-04 13:15:21 1080

原创层次聚类

假设有N个待聚类的样本，对于层次聚类来说，步骤： 1、（初始化）把每个样本归为一类，计算每两个类之间的距离，也就是样本与样本之间的相似度； 2、寻找各个类之间最近的两个类，把他们归为一类（这样类的总数就少了一个）； 3、重新计算新生成的这个类与各个旧类之间的相似度； 4、重复2和3直到所有样本点都归为一类，结束

2017-09-03 16:18:07 465

原创 K-means算法

1. 归类：聚类(clustering) 属于非监督学习 (unsupervised learning) 无类别标记(class label)2. 举例：3. K-means 算法： 3.1 Clustering 中的经典算法，数据挖掘十大经典算法之一 3.2 算法接受参数 k ；然后将事先

2017-09-03 11:21:55 230

原创非线性回归

1. 概率： 1.1 定义概率(P)robability: 对一件事情发生的可能性的衡量 1.2 范围 0 1.3 计算方法： 1.3.1 根据个人置信 1.3.2 根据历史数据 1.3.3 根据模拟数据 1.4 条件概率：

2017-07-29 22:18:41 4905

原创多元线性回归模型

1. 与简单线性回归区别(simple linear regression) 多个自变量(x)2. 多元回归模型 y=β0＋β１x1+β2x2+ ... +βpxp+ε 其中：β0，β１，β2... βp是参数 ε是误差值3. 多元回归方程 E(y)=β0＋β１x1+β2x2+ ..

2017-07-28 10:04:09 1651

原创线性回归模型

1. 简单线性回归模型举例：汽车卖家做电视广告数量与卖出的汽车数量：1.1 如何练出适合简单线性回归模型的最佳回归线/使sum of squares最小1.1.2 计算分子 = (1-2)(14-20)+(3-2)(24-20)+(2-2)(18-20)+(1-2)(17-20)+(3-2)(27-20) =

2017-07-28 09:42:24 563

原创神经网络算法的实例

1.简单非线性关系数据集测试（XOR)X: Y0 0 00 1 11 0 11 1 0Code: #!/usr/bin/env python#-*-coding:utf-8-*

2017-07-27 15:57:25 5528

原创神经网络算法实现

1. 关于非线性转化方程(non-linear transformation function)sigmoid函数(S 曲线)用来作为activation function: 1.1 双曲函数(tanh)tanh是双曲函数中的一个，tanh()为双曲正切。在数学中，双曲正切“tanh”是由基本双曲函数双曲正弦和双曲余弦推导而来公式定义双曲正切函数

2017-07-27 15:34:23 10048

原创神经网络NN算法

1. 背景: 1.1 以人脑中的神经网络为启发，历史上出现过很多不同版本 1.2 最著名的算法是1980年的 backpropagation 2. 多层向前神经网络(Multilayer Feed-Forward Neural Network) 2.1 Backpropagation被使用在多层向前神经网络上 2.2 多层向前神经网络由以

2017-07-27 14:25:22 2228

原创支持向量机(SVM)的实现

#!/usr/bin/env python#-*-coding:utf-8-*-#支持向量积的使用，建立超平面from sklearn import svmx=[[2,0],[1,1],[2,3]]y=[0,0,1]clf=svm.SVC(kernel='linear')#kernel='linear'线性核函数clf.fit(x,y)print(clf)prin

2017-07-25 15:22:01 555

转载支持向量机（SVM）算法

支持向量机（SVM）算法支持向量机(support vector machine)是一种分类算法，通过寻求结构化风险最小来提高学习机泛化能力，实现经验风险和置信范围的最小化，从而达到在统计样本量较少的情况下，亦能获得良好统计规律的目的。通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，即支持向量机的学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解

2017-07-25 15:12:21 328

空空如也

空空如也