自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 linux相关数据处理

提取关键字所在行并打印: grep "关键字" filename > res删除关键字所在行 : sed -i -e '/key/d' filename提取指定列:awk '{print $1}' filename > res遍历目录下文件名然后进行操作:for f in `ls`; do echo $f; rm -rf $f/*.wav; done删除当前目录下...

2019-03-03 19:37:14 325

原创 py 直接提取f0

import pyworld as pwimport soundfile as sfWAV_FILE = "aa.wav"x, fs = sf.read(WAV_FILE)f0, sp, ap = pw.wav2world(x, fs, fft_size=512, f0_floor=50)

2020-07-03 17:06:12 657

原创 按TextGrid来切割音频

from pydub import AudioSegmentimport ref=open("0.TextGrid","r",encoding='utf-8')#w=open('label','w')file_name = "0.wav"sound = AudioSegment.from_mp3(file_name)f.readline()time_start=0time_end...

2019-07-29 14:40:02 2622 9

原创 关于linux-gpu运行相关

1.在终端执行程序时指定GPUCUDA_VISIBLE_DEVICES=0pythonyour_file.py# 指定GPU集群中第一块GPU使用,其他的屏蔽掉CUDA_VISIBLE_DEVICES=1Only device 1 will be seenCUDA_VISIBLE_DEVICES=0,1Devices 0 an...

2019-07-02 14:29:15 648

原创 Jupyter 服务器配置(在外部电脑打开)

step1. 下载anaconda3https://www.anaconda.com/distribution/step2. 在服务器安装anaconda,然后conda install jupyterstep3. 生成配置文件:jupyter notebook --generate-config 生成密码:jupyter notebook passwor...

2019-05-17 20:32:39 2335

原创 关于用keras提取NN中间layer输出

Build model...__________________________________________________________________________________________________Layer (type) Output Shape Param # Connected to ...

2019-05-05 21:31:24 995

原创 关于deep feature、Tandem feature、bottleneck feature...

总是把这三个弄混...今天算是明白这三个不是一个概念...标黑的是每个特征的特性。*************************************************BN特征是属于深度特征,这一点无可非议。不过deep feature应该除了bottle neck之外还可以包括d-vector等等,这个概念在Google的2014年ICASSP《DEEP NEURAL...

2019-05-05 15:12:03 1142

原创 SVM与LR的异同

最近面试很多会聊到SVM, LR(毕竟两个非常成熟的machine learning method)并比较异同。这里复习一下~ 以后慢慢补自己的感悟。。参考:https://blog.csdn.net/b285795298/article/details/81977271相同点: 都是分类算法,监督学习算法,判别模型。如果不考虑kernel 函数,两个都是线性分类算法,也就是他们的决策面都...

2019-04-07 22:07:53 391

原创 关于近邻算法的感悟(KNN等)

前言: 在传统分类器例如(SVM,LDA,PLDA)等算法逐渐趋近完善的情况下。如何进一步提高系统性能?近邻算法能够在这些分类器走到90步的时候,能再push你往前走5步(indirect impore),即95步。一、什么是近邻算法。主要目的是通过找到目的类的邻近点(也就是混淆点)然后将其与目的类的点进行操作。目前我所看到的操作分为两类。1.对目的类每个近邻点和目的类...

2019-04-05 23:22:08 598

原创 矩阵余弦距离 欧式距离代码

spk_mean 3631x600dev_ivector 8631x600#-----------------------欧氏距离-----------------from scipy.spatial.distance import pdistEu_scores =np.zeros((3631,8631))for i in range(3631):    x = spk_mea...

2018-08-27 17:59:00 2068

原创 matlab、python中矩阵的互相导入导出

还有一种最流行的h5py.. 过几天更新------------------在python中导出矩阵至matlab------------------------------如果矩阵是mxn维的。 那么可以用 :np.savetxt('dev_ivector.csv', dev_ivector, delimiter = ',')对应matlab读取为:dev_i...

2018-08-22 10:41:57 8850 1

原创 Gaussian PLDA + 代码。

本文理解自07年Simon的《Probabilistic Linear Discriminant Analysis for Inferences About Identity》最直观的理解通过EM求四个latent variable。  EM求出了式子的四个参数。 然后下一步就是估计h和w啦 代码参考MSR工具箱...

2018-08-22 10:23:44 430

转载 白化

转自https://blog.csdn.net/zchang81/article/details/70211445 白化的目的是去除输入数据的冗余信息。例如:训练数据是图像,由于图像中相邻像素之间具有很强的相关性,因此输入是冗余的。白化的目的就是降低输入的冗余性。输入数据集,经过白化处理后,生成的新数据集满足两个条件:一是特征相关性较低;二是特征具有相同的方差。白化算法的实现过...

2018-08-15 10:23:16 1299

原创 关于为什么要进行Matrix normalization

物理意义:比如一个人说的话声音有时候声音很大,有时候很小,为了避免大声音和小声音在运算中过度影响结果,就需要将它们统一拉回一个特定的范畴轨道数学意义:本次研究基于18年MCE提供的baseline。该实验中用到了矩阵的列一化。矩阵的列归一化,就是将矩阵每一列的值,除以每一列所有元素平方和的根号值,这样做的结果就是,矩阵每一列元素的平方和为1了。def length_...

2018-08-10 13:04:15 2251 1

原创 lda+pca通过sklearn实现

from sklearn import datasetsimport matplotlib.pyplot as pltfrom sklearn.decomposition import PCAfrom sklearn.discriminant_analysis import LinearDiscriminantAnalysisfrom mpl_toolkits.mplot3d impor...

2018-07-31 15:42:20 479

原创 LDA推导 + python代码

参考blog:https://www.cnblogs.com/simon-c/p/5023726.html  只有代码和注释               https://blog.csdn.net/feilong_csdn/article/details/60964027   LDA线性判别原理解析<数学推导>               https://www.cnblogs...

2018-07-28 15:20:00 878

原创 GMM+EM算法+拉格朗日乘子

参考blog :zhang的gmm  https://blog.csdn.net/abcjennifer/article/details/8198352                zhang的EM  https://blog.csdn.net/abcjennifer/article/details/8170378               cnblog的EM http://www.c...

2018-07-23 14:01:06 792

原创 Kaldi学习-----上名词的一些理解(一)

acoustic scale: 通常设置为0.1,意味着声学模型的log概率得到的权重远低于语言模型。在Score的脚本中,经常会看到一系列要搜索的语言模型权重(例如7到15的范围)。 这些可以解释为声acoustic scale的倒数; 这是两者对维特比解码很重要的比例alignment:表示一句话通过维特比(最佳路径)对齐的HMM状态序列表示,与transtions-id同义。show-ali...

2018-07-12 17:26:30 835

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除