NonDay-CSDN博客

原创 c++/c#实现mnist手写字符识别，包括模型训练、推理预测

利用c++/c#实现mnist手写字符识别，包括模型训练、推理预测，依赖简单，开箱即用，全部通过代码实现，支持二次开发，以及gpu加速。

2024-04-18 21:43:29 362

原创 MNIST字符识别(C++)

【代码】MNIST字符识别(C++)

2023-10-12 20:34:07 226 1

原创表面缺陷检测-DAGM 2007

表面缺陷检测-DAGM 2007

2022-12-05 21:19:42 1070 2

原创工业质检相关数据集

工业质检相关数据集

2022-10-07 15:42:23 1137

原创 C++搭建http服务实现声纹识别

使用c++搭建声纹（说话人和说话人性别）识别服务。

2021-08-12 22:15:54 596

原创声纹识别之xvector

TDNN时延神经网络（TDNN）来自1989年的论文《Phoneme recognition using time-delay neural networks》。原文中主要使用TDNN来识别音素，在识别"B", "D", "G"三个浊音中得到98.5%的准确率，高于HMM的93.7%。普通神经网络识别音素在讲TDNN之前先说说一般的神经网络的是怎样识别音素的吧。假设要识别三个辅音"B"...

2020-04-21 21:59:59 7151 4

原创声纹识别资源汇总

Speaker Recognition2020Probabilistic embeddings for speaker diarization Deep Normalization for Speaker Vectors Bayesian x-vector: Bayesian Neural Network based x-vector System for Speaker Verifi...

2020-04-09 21:40:08 931 1

原创声纹识别SDK-FreeSR

FreeSR (A Free Library for Speaker Recognition)，免费的声纹识别/性别识别SDK，支持Android/Windows/Linux等平台。1.实现算法： GMM-UBM I-Vector2.功能说话人识别（验证），包括注册/识别两个阶段（GMM-UBM/I-Vector）性别识别，根据语音片段判断性别（GMM-UBM...

2019-10-08 19:43:34 2467 5

原创微软说话人识别工具箱(MSR Identity Toolbox)应用与实践教程

微软说话人识别工具箱1 (MSR Identity Toolbox) 是由微软研究院开源的声纹识别工具，使用 MATLAB 语言编写。主要包含了 GMM-UBM 和 I-Vector 两种声纹识别核心算法源代码以及说明文档，但是并不涉及特征提取、语音端点检测 (Voice Activity Detection, VAD) 等内容，对于初学者来说想要使用该工具箱训练自己的模型并建立起完...

2019-05-22 21:15:57 3092 2

原创声纹识别之Alize入门教程(四)：matlab代码读取Spro工具提取的mfcc特征

Alize说话人识别工具箱使用的是语音信号处理工具SPro进行mfcc特征提取，对于WAV格式的音频，mfcc特征提取命令为：bin/sfbcep -m -k 0.97 -p19 -n 24 -r 22 -e -D -A -F wave test.wav test.tmp.prm保存的mfcc特征文件test.tmp.prm，前10个字节是非特征信息，每一帧的特征维度为60，读取代码如下：...

2019-05-16 21:01:34 1137

原创基于C++实现的ivector说话人识别SDK

根据语音片段进行说话人识别的SDK，c/c++实现。利用ivector算法，进行说话人识别，包含了一个基础的ivector模型(6M)，效果一般优于gmm-ubm算法。wav文件不要超过1M大小。1.WindowsWin10 and VS2013环境配置参考《说话人识别和说话人性别识别SDK-通过语音判断说话人，及说话人的性别》。因为ivector比gmm-ubm计算量更大，...

2019-04-09 20:16:52 1692 5

原创说话人识别和说话人性别识别SDK-通过语音判断说话人，及说话人的性别

根据语音片段进行性别判断，以及说话人识别的SDK，c/c++实现。利用GMM-UBM算法，可以进行说话人识别，或者性别识别，可以参考<声纹识别之Alize入门教程(二)：GMM-UBM>。进行性别识别的时候，将不同的性别视为不同的说话人即可。1.WindowsWin10 and VS2013。新建空项目=>选择项目，右键属性=>c/c++=>常规...

2019-04-03 20:07:42 4216 2

原创声纹识别之Alize入门教程(三)：I-vector

Alize完整的ivector例程，包括：数据准备、特征提取、训练以及测试等。最终生成的得分文件res/scores_PLDA_lengthnorm.txt，其含义参考GMM-UBM。M S0002 1 BAC009S0002W0122 0.644295M S0003 1 BAC009S0002W0122 0.520998M S0004 1 BAC009S0002W0122 0.4846...

2019-03-21 21:12:52 2727 10

原创声纹识别之Alize入门教程(二)：GMM-UBM

准备工作Alize官网https://alize.univ-avignon.fr有四个demo：1.GMM/UBM System2.I-vector System3.JFA System4.Top-down Speaker Segmenting and Clustering System下载第一个GMM-UBM例子01_GMM-UBM_system_with_ALIZE...

2019-03-20 20:40:13 6204 11

原创声纹识别之Alize入门教程(一)：环境配置

主要参考《说话人识别ALIZE工具包的编译》：http://www.cnblogs.com/yuersthe1/p/3671384.htmlwindows10vs20131.下载alize-core和LIA_RALhttps://github.com/ALIZE-Speaker-Recognition/LIA_RALhttps://github.com/ALIZE-Speake...

2019-03-18 20:19:07 3405

原创声纹识别开源工具

声纹识别，也称为说话人识别，主要的开源工具有：1.MSR Identity Toolkit ，微软开源的工具箱，MATLAB版本，包含GMM-UBM和I-vector的demo，简单易用。下载地址2.Alize，主要包括GMM-UBM、I-vector andJFA三种传统的方法，C++版，简单易用。3.kaldi,当下十分流行的语音识别工具包，也包括声纹识别：覆盖了主流的声纹识别算...

2018-03-26 21:38:18 19404 5

c++/c#实现mnist手写字符识别，包括模型训练、推理预测

利用c++/c#实现mnist手写字符识别，包括模型训练、推理预测，依赖简单，开箱即用，全部通过代码实现，支持二次开发，以及gpu加速。配置好的c++工程。文章地址：https://blog.csdn.net/u012594175/article/details/137289835?spm=1001.2014.3001.5501

2024-04-18

c++/c#实现mnist手写字符识别，包括模型训练、推理预测

利用c++/c#实现mnist手写字符识别，包括模型训练、推理预测，依赖简单，开箱即用，全部通过代码实现，支持二次开发，以及gpu加速。配置好的c#工程。文章地址： https://blog.csdn.net/u012594175/article/details/137289835?spm=1001.2014.3001.5501

2024-04-18