ScottRD-CSDN博客

原创 Kaldi语音识别学习记录-----编译安装

语音识别领域的开源框架有CMUSphinx、HTK、Kaldi等等，而目前仍然比较活跃，且工程价值较高的就数Kaldi，很多从事语音方面的公司，都使用该框架训练自己的语音识别能力，由于其内部代码逻辑较为复杂，故这里一步一步来解读，了解语音识别的内部原理，并期望自定义，实现业务场景下的语音识别、语音唤醒等引擎。一、准备工作学习kaldi需要一定的语言基础，尤其是C++，基本上工具以及代码都是基于C++语言实现起来的，所以它相对python等语言还是有一定的门槛，大家在学习工作中，多读多写。从事算法研究

2020-12-01 16:24:46 635

原创 unimrcp负载

做呼叫中心或者语音导航等场景中，经常需要支持MRCP协议，目前主流的MRCP服务都借鉴了unimrcp的框架，并在该框架中编写自己的插件来实现ASR、TTS能力。但是unimrcp并没有给出集群的解决方案，所以在工程化中，要解决单点问题才能达到真正的可用性。故这里使用nginx来代理sip消息的负载来实现unimrcp的负载，以TCP的sip协议为例：在nginx.conf中添加sip消息的负载均衡：stream { upstream mrcp-server {

2020-11-06 16:55:14 1162

原创 CSerialPort自动重连机制

在工作中，从事软硬件工作的小伙伴经常会用到串口通信，尤其是windows系统下，传输消息。笔者前段时间做的麦克风阵列上的本地AI引擎（ASR、TTS、NLP）用于语音交互，其中的结果通过串口协议发送给PC机上，在Github找了个两个串口模块，分别是WzSerialPort和CSerialPort，二者均封装了Windows的API，从工程化程度和使用对比看，CSerialPort更优。主要是因为WzSerialPort在调试中经常出现偶现的报错，没有具体去分析原因。在使用CSerialPort的过程中，

2020-11-06 12:05:06 546

SRS开源代码

SRS开源代码，用于直播点播系统，支持编解码，可用于搭建直播、录播系统

2018-04-17

json handler

360浏览器上json handler插件，直接拖拽到浏览器中进行安装

2018-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人