灵声讯-CSDN博客

原创音频编解码介绍（最全v1.0）

音频编解码介绍（最全v1.0）目录：1.PCMU(G.711U)2.PCMA(G.711A)3.ADPCM4.LPC(Linear Predictive Coding)5.CELP(Code Excited Linear Prediction)6.G.7117.G.7218.G.7229.G.72310.G.723.111.G.72812.G.72913.G.729A14.GIPS15.SILK16.NICAM(Near ...

2020-12-18 21:06:24 6722 3

原创语音信号处理领域国内外大师汇总(二)

语音信号处理领域国内外大师汇总(二) 本内容由灵声讯音频-语音算法实验室整理，转载和使用请与“灵声讯”联系，联系方式：音频/识别/合成算法QQ群（696554058）haizhou li主页：https://www.researchgate.net/profile/Haizhou_Li李海洲现任新加坡国立大学电气与计算机工程系终身教授，澳大利亚新南威...

2020-06-23 19:51:51 1739

原创语音信号处理领域国内外高手homepage分享(一)

详细内容见群文件，欢迎大家加入音频/识别/合成算法群（696554058）交流学习，谢谢！本内容原创，转载和使用请注明出处，谢谢配合；Zheng-Hua Tan 的主页：http://kom.aau.dk/~zt/index.htm#Research%20interests （谭政华博士曾经是美国麻省理工学院（MIT）计算机科学与人工智能实验室（CSAIL）的客座科学家/教授，...

2020-06-22 11:29:58 10452 2

原创 matlab在多媒体算法处理中的应用

欢迎大家加入音频/识别/合成算法群（696554058）交流学习，谢谢！本文主要是用matlab完成各色物品的制作，通过编程熟悉matlab的基本用法，本文原创，转载和使用请注明出处；所有的源码都可以通过关注公众号（天一色）获取。%-------------------------大花瓶——————————————————————%------------------制作...

2020-06-20 16:03:32 770

原创基于DTW的孤立词语音识别系统（文档+MATLAB+GUI）

基于DTW的孤立词语音识别系统（文档+MATLAB+GUI）本内容部分原创，因作者才疏学浅，偶有纰漏，望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作，转载和使用请与“灵声讯”联系，联系方式：QQ（245051943）引言.......................................................................

2020-06-20 16:02:41 6270 6

原创语音情感识别

语音情感识别本内容由灵声讯音频-语音算法实验室整理，转载和使用请与“灵声讯”联系，联系方式：音频/识别/合成算法QQ群（696554058）...

2020-06-20 16:02:11 971

翻译基于CTC转换器的自动拼写校正端到端语音识别

基于CTC转换器的自动拼写校正端到端语音识别 Automatic Spelling Correction with Transformer for CTC-based End-to-End ...

2019-09-20 18:43:02 1100

原创从发声机理到听觉感知认识声音的本质

从发声机理到听觉感知认识声音的本质本内容全原创，因作者才疏学浅，偶有纰漏，望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作，转载和使用请与“灵声讯”联系，联系方式：音频/识别/合成算法QQ群（696554058）§1.1 语音产生与感知语音信号的产生和感知对应不同的数学模型，为了处理和实现更加简便，要求数学模型应...

2019-07-02 20:10:21 4021

原创连麦互动直播中混屏技术设计

连麦互动直播中混屏技术设计目录一．混屏原理二．实现混屏关键技术1. 并发解码2. 图像合成3. 视频同步4. 编码输出5. 内存管理三．具体实现流程1、混屏流程2、混屏算法四．音视频同步五．总结参考文献：本内容全原创，因作者才疏学浅，偶有纰漏，望不吝指出。本内容由灵...

2019-05-10 09:43:55 848

翻译 PYTORCH-KALDI语音识别工具包

PYTORCH-KALDI语音识别工具包 Mirco Ravanelli1，Titouan Parcollet2，Yoshua Bengio1 * ...

2019-04-29 20:59:58 7940 2

原创基于SVM的语音情感识别系统设计

基于SVM的语音情感识别系统设计目录基于SVM的语音情感识别系统设计1 引言2 情感语音信号的采集3. 特征参数§3.1 基音频率参数§3.3 能量参数4 语音情感的识别§4.1 采用高斯分布模型的分类§4.2 SVM分类器的原理§4.3 数据分析及整理...

2019-04-20 18:32:16 9040 9

原创语音识别技术简述（概念->原理）

语音识别技术简述（概念->原理）目录语音识别技术简述（概念->原理）语音识别概念语音识别原理语音识别技术简介 1.动态时间规整（DTW） 2.支持向量机（SVM） 3.矢量量化（VQ） 4.隐马尔科夫模型（HMM） 5.高斯混合模型（GMM） 6.人工神经网络...

2019-04-12 10:21:44 25635

原创语音相似度打分技术说明【音频质量专题】

语音相似度打分技术说明【音频质量专题】 ...

2019-03-28 19:46:22 11553 2

原创语音识别行业技术和市场横向对比

语音识别行业技术和市场横向对比本内容全原创，因作者才疏学浅，偶有纰漏，望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作，转载和使用请与“灵声讯”联系，联系方式：音频/识别/合成算法QQ群（696554058）公司简称语音相关产品核心技术重点客户备注 ...

2019-03-28 10:45:53 6225 1

原创语音识别语料库的建立与语料收集

语音识别语料库的建立与语料收集目录语音识别语料库的建立与语料收集核心需求关键表属性 ASR-CDB逻辑结构图维护扩张本内容全原创，因作者才疏学浅，偶有纰漏，望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作，转载和使用请与“灵声讯”联系，联系方式：音频/识别/合成算法QQ群（696554...

2019-03-26 20:13:14 10233 1

原创音频带宽预测与动态参数调整优化报告【音频质量专题】

音频带宽预测与动态参数调整优化报告目录音频带宽预测与动态参数调整优化报告优化背景与目的优化内容与思路测试结果汇总A. 随机丢包网络B.带宽受限网络C.实际网络优化结论本内容全原创，因作者才疏学浅，偶有纰漏，望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作，转载和使用请与...

2019-03-19 21:07:29 1572

原创语音质量评价方法-【音频质量专题】

语音质量评价方法-【音频质量专题】主要内容：1.信噪比(Signal-to-NoiseRatio，SNR)2.分段信噪比(Segment Signal-to-Noise Ratio，SegSNR)3.PESQ(PerceptualEvaluationofSpeechQuality)4.对数似然比测度（Log...

2019-03-13 16:16:12 10474 1

原创音频频率和体验知识汇总-【音频质量专题】

音频频率和体验知识汇总-【音频质量专题】主要内容：一.乐器人声频率知识二.美声-各频段处理方式三.各频段特点与评价术语部分内容来源于网络和书籍，在此先表感谢，因作者才疏学浅，偶有纰漏，望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作，转载和使用请与“灵声讯”联系，联系方式：音频/识别/合成算法QQ群（6965...

2019-03-11 11:33:59 1528

翻译 WAV2LETTER ++：最快的开源语音识别系统

WAV2LETTER ++：最快的开源语音识别系统Vineel Pratap, Awni Hannun, Qiantong Xu, Jeff Cai, Jacob Kahn, Gabriel Synnaeve,Vitaliy Liptchinsky, R...

2019-03-08 16:33:15 3097

原创 SoundTouch与Rubber Band Library变声算法对比与ASR结果分析

详细内容见群文件，欢迎大家加入音频/识别/合成算法群（696554058）交流学习，谢谢！本内容原创，转载和使用请注明出处，谢谢配合；变声背景与目的目前基于对语音识别数据收集缓慢且质量不高的情况，内部开会决定尝试用变声算法来实现数据翻倍，前期已实现通过加不同特征的噪声实现数据翻倍，测试结果证明识别鲁棒性明显增强了。变声算法理论上可以实现任意维度的声音变化，但基于对K12口语语音识别考虑，...

2019-02-18 14:59:14 1783