自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (15)
  • 收藏
  • 关注

原创 c++/c#实现mnist手写字符识别,包括模型训练、推理预测

利用c++/c#实现mnist手写字符识别,包括模型训练、推理预测,依赖简单,开箱即用,全部通过代码实现,支持二次开发,以及gpu加速。

2024-04-18 21:43:29 362

原创 MNIST字符识别(C++)

【代码】MNIST字符识别(C++)

2023-10-12 20:34:07 226 1

原创 表面缺陷检测-DAGM 2007

表面缺陷检测-DAGM 2007

2022-12-05 21:19:42 1070 2

原创 工业质检相关数据集

工业质检相关数据集

2022-10-07 15:42:23 1137

原创 C++搭建http服务实现声纹识别

使用c++搭建声纹(说话人和说话人性别)识别服务。

2021-08-12 22:15:54 596

原创 声纹识别之xvector

TDNN时延神经网络(TDNN)来自1989年的论文《Phoneme recognition using time-delay neural networks》。原文中主要使用TDNN来识别音素,在识别"B", "D", "G"三个浊音中得到98.5%的准确率,高于HMM的93.7%。普通神经网络识别音素在讲TDNN之前先说说一般的神经网络的是怎样识别音素的吧。假设要识别三个辅音"B"...

2020-04-21 21:59:59 7151 4

原创 声纹识别资源汇总

Speaker Recognition2020Probabilistic embeddings for speaker diarization Deep Normalization for Speaker Vectors Bayesian x-vector: Bayesian Neural Network based x-vector System for Speaker Verifi...

2020-04-09 21:40:08 931 1

原创 声纹识别SDK-FreeSR

FreeSR (A Free Library for Speaker Recognition),免费的声纹识别/性别识别SDK,支持Android/Windows/Linux等平台。1.实现算法: GMM-UBM I-Vector2.功能 说话人识别(验证),包括注册/识别两个阶段(GMM-UBM/I-Vector) 性别识别,根据语音片段判断性别(GMM-UBM...

2019-10-08 19:43:34 2467 5

原创 微软说话人识别工具箱(MSR Identity Toolbox)应用与实践教程

微软说话人识别工具箱1 (MSR Identity Toolbox) 是由微软研究院开 源的声纹识别工具,使用 MATLAB 语言编写。主要包含了 GMM-UBM 和 I-Vector 两种声纹识别核心算法源代码以及说明文档,但是并不涉及特征提 取、语音端点检测 (Voice Activity Detection, VAD) 等内容,对于初学者 来说想要使用该工具箱训练自己的模型并建立起完...

2019-05-22 21:15:57 3092 2

原创 声纹识别之Alize入门教程(四):matlab代码读取Spro工具提取的mfcc特征

Alize说话人识别工具箱使用的是语音信号处理工具SPro进行mfcc特征提取,对于WAV格式的音频,mfcc特征提取命令为:bin/sfbcep -m -k 0.97 -p19 -n 24 -r 22 -e -D -A -F wave test.wav test.tmp.prm保存的mfcc特征文件test.tmp.prm,前10个字节是非特征信息,每一帧的特征维度为60,读取代码如下:...

2019-05-16 21:01:34 1137

原创 基于C++实现的ivector说话人识别SDK

根据语音片段进行说话人识别的SDK,c/c++实现。利用ivector算法,进行说话人识别,包含了一个基础的ivector模型(6M),效果一般优于gmm-ubm算法。wav文件不要超过1M大小。1.WindowsWin10 and VS2013环境配置参考《说话人识别和说话人性别识别SDK-通过语音判断说话人,及说话人的性别》。因为ivector比gmm-ubm计算量更大,...

2019-04-09 20:16:52 1692 5

原创 说话人识别和说话人性别识别SDK-通过语音判断说话人,及说话人的性别

根据语音片段进行性别判断,以及说话人识别的SDK,c/c++实现。利用GMM-UBM算法,可以进行说话人识别,或者性别识别,可以参考<声纹识别之Alize入门教程(二):GMM-UBM>。进行性别识别的时候,将不同的性别视为不同的说话人即可。1.WindowsWin10 and VS2013。新建空项目=>选择项目,右键属性=>c/c++=>常规...

2019-04-03 20:07:42 4216 2

原创 声纹识别之Alize入门教程(三):I-vector

Alize完整的ivector例程,包括:数据准备、特征提取、训练以及测试等。最终生成的得分文件res/scores_PLDA_lengthnorm.txt,其含义参考GMM-UBM。M S0002 1 BAC009S0002W0122 0.644295M S0003 1 BAC009S0002W0122 0.520998M S0004 1 BAC009S0002W0122 0.4846...

2019-03-21 21:12:52 2727 10

原创 声纹识别之Alize入门教程(二):GMM-UBM

准备工作Alize官网https://alize.univ-avignon.fr有四个demo:1.GMM/UBM System2.I-vector System3.JFA System4.Top-down Speaker Segmenting and Clustering System下载第一个GMM-UBM例子01_GMM-UBM_system_with_ALIZE...

2019-03-20 20:40:13 6204 11

原创 声纹识别之Alize入门教程(一):环境配置

主要参考《说话人识别ALIZE工具包的编译》:http://www.cnblogs.com/yuersthe1/p/3671384.htmlwindows10vs20131.下载alize-core和LIA_RALhttps://github.com/ALIZE-Speaker-Recognition/LIA_RALhttps://github.com/ALIZE-Speake...

2019-03-18 20:19:07 3405

原创 声纹识别开源工具

声纹识别,也称为说话人识别,主要的开源工具有:1.MSR Identity Toolkit ,微软开源的工具箱,MATLAB版本,包含GMM-UBM和I-vector的demo,简单易用。下载地址2.Alize,主要包括GMM-UBM、I-vector andJFA三种传统的方法,C++版,简单易用。3.kaldi,当下十分流行的语音识别工具包,也包括声纹识别:覆盖了主流的声纹识别算...

2018-03-26 21:38:18 19404 5

c++/c#实现mnist手写字符识别,包括模型训练、推理预测

利用c++/c#实现mnist手写字符识别,包括模型训练、推理预测,依赖简单,开箱即用,全部通过代码实现,支持二次开发,以及gpu加速。配置好的c++工程。文章地址:https://blog.csdn.net/u012594175/article/details/137289835?spm=1001.2014.3001.5501

2024-04-18

c++/c#实现mnist手写字符识别,包括模型训练、推理预测

利用c++/c#实现mnist手写字符识别,包括模型训练、推理预测,依赖简单,开箱即用,全部通过代码实现,支持二次开发,以及gpu加速。配置好的c#工程。文章地址: https://blog.csdn.net/u012594175/article/details/137289835?spm=1001.2014.3001.5501

2024-04-18

caffe-3rdparty-vs2015x64

win10下caffe依赖的第三开源方库,caffe-3rdparty-vs2015x64

2022-09-21

ZlwAudioRecorder.rar

声纹识别Android工程,包括性别识别、说话人识别。gmm-ubm、ivector算法。 详见https://blog.csdn.net/u012594175

2020-04-02

android版本说话人性别识别以及声纹识别.rar

android版本说话人性别识别以及声纹识别,对应博客https://blog.csdn.net/u012594175/article/details/89003815

2019-05-24

基于ivector的说话人识别SDK

vs2013;win10;基于ivector的说话人识别SDK。参考 https://blog.csdn.net/u012594175/article/details/89108535

2019-04-09

基于Alize的ivector算法

基于Alize的ivector算法,《声纹识别之Alize入门教程(三):I-vector》对应资源。https://blog.csdn.net/u012594175/article/details/88726163

2019-04-09

基于Alize的GMM-UBM算法

基于Alize的GMM-UBM算法,《声纹识别之Alize入门教程(二):GMM-UBM》对应资源。https://blog.csdn.net/u012594175/article/details/88698118

2019-04-09

说话人识别和说话人性别识别SDK

windows 10; vs2013; 说话人识别和说话人性别识别SDK,利用GUMM-UBM算法实现。https://blog.csdn.net/u012594175/article/details/89003815

2019-04-04

Alize说话人识别工具在window平台的编译

Alize说话人识别工具在window平台的编译,vs2013编译通过,已配置好,解压直接生成解决方案即可:单独编译liatools那个项目,再逐个项目进行编译

2019-03-19

基于ivector的声纹验证demo

基于ivector的声纹验证demo,c++实现,包含一个基础的ivector模型。

2018-09-27

两小时学会Git玩转Github

两小时学会Git玩转Github,公开课真实共享Word文档,两小时学会Git玩转Github,公开课真实共享Word文档,

2017-10-23

传智播客Javappt大全

传智播客Javappt大全

2016-11-09

CC++中国象棋程序入门与提高的配套源代码

《CC++中国象棋程序入门与提高》的配套源代码

2016-07-26

卷积神经网络经典代码代码

卷积神经网络经典代码代码,可以直接运行。卷积神经网络MATLAB代码

2015-09-09

PC游戏编程

PC游戏编程,中国象棋。人机博弈,以中国象棋为案例进行分析。

2015-09-06

MATAB神经网络30个案例分析

[MATAB神经网络30个案例分析].史峰.扫描版,30个案例完整版

2015-09-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除