自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (2)
  • 收藏
  • 关注

原创 Kaldi语音识别学习记录-----编译安装

语音识别领域的开源框架有CMUSphinx、HTK、Kaldi等等,而目前仍然比较活跃,且工程价值较高的就数Kaldi,很多从事语音方面的公司,都使用该框架训练自己的语音识别能力,由于其内部代码逻辑较为复杂,故这里一步一步来解读,了解语音识别的内部原理,并期望自定义,实现业务场景下的语音识别、语音唤醒等引擎。一、准备工作学习kaldi需要一定的语言基础,尤其是C++,基本上工具以及代码都是基于C++语言实现起来的,所以它相对python等语言还是有一定的门槛,大家在学习工作中,多读多写。从事算法研究

2020-12-01 16:24:46 635

原创 unimrcp负载

做呼叫中心或者语音导航等场景中,经常需要支持MRCP协议,目前主流的MRCP服务都借鉴了unimrcp的框架,并在该框架中编写自己的插件来实现ASR、TTS能力。但是unimrcp并没有给出集群的解决方案,所以在工程化中,要解决单点问题才能达到真正的可用性。故这里使用nginx来代理sip消息的负载来实现unimrcp的负载,以TCP的sip协议为例:在nginx.conf中添加sip消息的负载均衡:stream { upstream mrcp-server {

2020-11-06 16:55:14 1162

原创 CSerialPort自动重连机制

在工作中,从事软硬件工作的小伙伴经常会用到串口通信,尤其是windows系统下,传输消息。笔者前段时间做的麦克风阵列上的本地AI引擎(ASR、TTS、NLP)用于语音交互,其中的结果通过串口协议发送给PC机上,在Github找了个两个串口模块,分别是WzSerialPort和CSerialPort,二者均封装了Windows的API,从工程化程度和使用对比看,CSerialPort更优。主要是因为WzSerialPort在调试中经常出现偶现的报错,没有具体去分析原因。在使用CSerialPort的过程中,

2020-11-06 12:05:06 546

SRS开源代码

SRS开源代码,用于直播点播系统,支持编解码,可用于搭建直播、录播系统

2018-04-17

json handler

360浏览器上json handler插件,直接拖拽到浏览器中进行安装

2018-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除