自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

king_audio_video的博客

语音信号处理-语音识别-语音合成

  • 博客(32)
  • 资源 (16)
  • 收藏
  • 关注

原创 音频编解码介绍(最全v1.0)

音频编解码介绍(最全v1.0)目录:1.PCMU(G.711U)2.PCMA(G.711A)3.ADPCM4.LPC(Linear Predictive Coding)5.CELP(Code Excited Linear Prediction)6.G.7117.G.7218.G.7229.G.72310.G.723.111.G.72812.G.72913.G.729A14.GIPS15.SILK16.NICAM(Near ...

2020-12-18 21:06:24 6722 3

原创 语音信号处理领域国内外大师汇总(二)

语音信号处理领域国内外大师汇总(二) 本内容由灵声讯音频-语音算法实验室整理,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058)haizhou li主页:https://www.researchgate.net/profile/Haizhou_Li李海洲现任新加坡国立大学电气与计算机工程系终身教授,澳大利亚新南威...

2020-06-23 19:51:51 1739

原创 语音信号处理领域国内外高手homepage分享(一)

详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;Zheng-Hua Tan 的主页:http://kom.aau.dk/~zt/index.htm#Research%20interests (谭政华博士曾经是美国麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的客座科学家/教 授,...

2020-06-22 11:29:58 10452 2

原创 matlab在多媒体算法处理中的应用

欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本文主要是用matlab完成各色物品的制作,通过编程熟悉matlab的基本用法,本文原创,转载和使用请注明出处;所有的源码都可以通过关注公众号(天一色)获取。%-------------------------大花瓶——————————————————————%------------------制作...

2020-06-20 16:03:32 770

原创 基于DTW的孤立词语音识别系统(文档+MATLAB+GUI)

基于DTW的孤立词语音识别系统(文档+MATLAB+GUI)本内容部分原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:QQ(245051943)引言.......................................................................

2020-06-20 16:02:41 6270 6

原创 语音情感识别

语音情感识别 本内容由灵声讯音频-语音算法实验室整理,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058)...

2020-06-20 16:02:11 971

翻译 基于CTC转换器的自动拼写校正端到端语音识别

基于CTC转换器的自动拼写校正端到端语音识别 Automatic Spelling Correction with Transformer for CTC-based End-to-End ...

2019-09-20 18:43:02 1100

原创 从发声机理到听觉感知认识声音的本质

从发声机理到听觉感知认识声音的本质本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058)§1.1 语音产生与感知语音信号的产生和感知对应不同的数学模型,为了处理和实现更加简便,要求数学模型应...

2019-07-02 20:10:21 4021

原创 连麦互动直播中混屏技术设计

连麦互动直播中混屏技术设计目录一.混屏原理二.实现混屏关键技术1. 并发解码2. 图像合成3. 视频同步4. 编码输出5. 内存管理三.具体实现流程1、混屏流程2、混屏算法四.音视频同步五.总结参考文献:本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵...

2019-05-10 09:43:55 848

翻译 PYTORCH-KALDI语音识别工具包

PYTORCH-KALDI语音识别工具包 Mirco Ravanelli1,Titouan Parcollet2,Yoshua Bengio1 * ...

2019-04-29 20:59:58 7940 2

原创 基于SVM的语音情感识别系统设计

基于SVM的语音情感识别系统设计目录 基于SVM的语音情感识别系统设计1 引言2 情感语音信号的采集3. 特征参数§3.1 基音频率参数§3.3 能量参数4 语音情感的识别§4.1 采用高斯分布模型的分类§4.2 SVM分类器的原理§4.3 数据分析及整理...

2019-04-20 18:32:16 9040 9

原创 语音识别技术简述(概念->原理)

语音识别技术简述(概念->原理)目录语音识别技术简述(概念->原理)语音识别概念语音识别原理语音识别技术简介 1.动态时间规整(DTW) 2.支持向量机(SVM) 3.矢量量化(VQ) 4.隐马尔科夫模型(HMM) 5.高斯混合模型(GMM) 6.人工神经网络...

2019-04-12 10:21:44 25635

原创 语音相似度打分技术说明【音频质量专题】

语音相似度打分技术说明【音频质量专题】 ...

2019-03-28 19:46:22 11553 2

原创 语音识别行业技术和市场横向对比

语音识别行业技术和市场横向对比 本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058) 公司简称 语音相关产品 核心技术 重点客户 备注 ...

2019-03-28 10:45:53 6225 1

原创 语音识别语料库的建立与语料收集

语音识别语料库的建立与语料收集 目录 语音识别语料库的建立与语料收集 核心需求 关键表属性 ASR-CDB逻辑结构图 维护扩张 本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554...

2019-03-26 20:13:14 10233 1

原创 音频带宽预测与动态参数调整优化报告【音频质量专题】

音频带宽预测与动态参数调整优化报告目录 音频带宽预测与动态参数调整优化报告优化背景与目的优化内容与思路测试结果汇总A. 随机丢包网络B.带宽受限网络C.实际网络优化结论本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与...

2019-03-19 21:07:29 1572

原创 语音质量评价方法-【音频质量专题】

语音质量评价方法-【音频质量专题】主要内容:1.信噪比(Signal-to-NoiseRatio,SNR)2.分段信噪比(Segment Signal-to-Noise Ratio,SegSNR)3.PESQ(PerceptualEvaluationofSpeechQuality)4.对数似然比测度(Log...

2019-03-13 16:16:12 10474 1

原创 音频频率和体验知识汇总-【音频质量专题】

音频频率和体验知识汇总-【音频质量专题】主要内容:一.乐器人声频率知识二.美声-各频段处理方式三.各频段特点与评价术语部分内容来源于网络和书籍,在此先表感谢,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(6965...

2019-03-11 11:33:59 1528

翻译 WAV2LETTER ++:最快的开源语音识别系统

WAV2LETTER ++:最快的开源语音识别系统Vineel Pratap, Awni Hannun, Qiantong Xu, Jeff Cai, Jacob Kahn, Gabriel Synnaeve,Vitaliy Liptchinsky, R...

2019-03-08 16:33:15 3097

原创 SoundTouch与Rubber Band Library变声算法对比与ASR结果分析

详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;变声背景与目的目前基于对语音识别数据收集缓慢且质量不高的情况,内部开会决定尝试用变声算法来实现数据翻倍,前期已实现通过加不同特征的噪声实现数据翻倍,测试结果证明识别鲁棒性明显增强了。变声算法理论上可以实现任意维度的声音变化,但基于对K12口语语音识别考虑,...

2019-02-18 14:59:14 1783

原创 语音识别-声纹识别-语音合成【专题五】

详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;

2019-02-02 10:27:36 519

原创 语音识别-声纹识别-语音合成【专题四】

详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;

2019-02-02 10:25:19 558

原创 语音识别-声纹识别-语音合成【专题三】

详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;

2019-02-02 10:22:15 649 1

原创 语音识别-声纹识别-语音合成【专题二】

详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;

2019-02-02 10:19:27 521 1

原创 语音识别-声纹识别-语音合成【专题一】

详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;

2019-02-02 10:14:13 2590 2

原创 语音识别技术的发展与应用

本内容原创,转载和使用请注明出处,谢谢配合;欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!

2019-02-01 18:03:13 10319 1

原创 音频前后端算法-语音识别-语音合成

欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!2019年与志同道合的兄弟们在语音、音频领域干点实在的,有愿意的准备好上车。目前有开往三个方向的车,请根据实际情况选择上下车:1. 音频前后端处理算法(包括但不限于3A,均衡,麦克风阵列,混响,断点检测等)2. 语音识别(包括但不限于声纹,情感,年龄,性别,评测等)3. 语音合成(包括但不限于合成,变声,转换等)...

2019-02-01 13:10:52 3980

原创 【基于MATLAB 的VQ声纹识别系统】

基于MATLAB 的VQ声纹识别系统本内容由灵声讯音频-语音算法实验室整理,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群目 录摘 要.......................................................................................................... IABSTRACT. II第1章 引 言... 11.1语音识别的背景...

2022-01-28 12:19:30 4337

原创 音频带宽预测与动态参数调整优化报告

音频带宽预测与动态参数调整优化报告优化背景与目的基于18年8月份对listensin项目开发,还存在弱网络环境下动态参数调整不合理或不匹配的情况,导致点对点音频质量下降明显造成沟通不畅等问题,近期在依照友商产品体验的基础上进行全方位优化和改善。经过多轮反复试验,最终在原来优化的基础上增加了音频带宽估计和探测模块,实时探测网络状态以此来增加动态参数调整的精准...

2022-01-28 12:07:50 310

原创 语音识别语料收集及语料库制作

语音识别语料收集及语料库制作目录 语音识别语料收集及语料库制作数据交易平台:语料库建立方法:语料库制作规范和过程:本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”...

2019-03-22 09:48:45 5879

转载 线代实现:blas, lapack, cblas, clapack, armadillo, openblas, mkl

关于blas的介绍介绍见:http://www.cnblogs.com/dzyBK/p/4983953.html blas:提供向量和矩阵的基本运算,用fortran编写。lapack:提供向量和矩阵的高级运算,用fortran编写,内部以blas为基础库。 cblas:提供c接口的blas库,源码通过f2c转换为C语言。f2c官网:http://www.netlib.org/f2c/clapac...

2018-03-05 14:22:31 977

转载 【WebRTC】回声抵消(aec、aecm)算法简介

【WebRTC】回声抵消(aec、aecm)算法简介webrtc 的回声抵消(aec、aecm)算法主要包括以下几个重要模块:1.回声时延估计 2.NLMS(归一化最小均方自适应算法) 3.NLP(非线性滤波) 4.CNG(舒适噪声产生),一般经典aec算法还应包括双端检测(DT)。考虑到webrtc使用的NLMS、NLP和CNG都属于经典算法范畴,故只做简略介绍,本文重点介绍webr

2016-06-07 11:31:53 1622 1

桂林电子科技大学2017年研究生入学考试试卷(所有学院考试科目)

感谢深圳新丰收教育科技有限公司分享人工智能白皮书,内容真实完整。 新丰收,全名深圳新丰收教育科技有限公司,成立于2016.12月,总部位于深圳市宝安区,是规模较大的行业培训和技能培训的综合性培训公司。自成立以来一直秉承“资源整合,服务你我”的企业遵旨,依托职业技能培训,职业规划培训和团队建设培训三大业务板块,让每一个客户都能享受到互联网+和大数据+带来的便利,同时整合团队内部不同领域不同行业的人脉资源,打造全新的猎聘生态和职场生态。公司核心团队均来自BAT等国内外大公司,一部分精英还来自FACEBOOK,GOOGLE,APPLE等顶尖公司。希望我们卓越的团队能为您提供高效满意的服务。 讲师:天一色团队 感谢深圳新丰收教育科技有限公司对猎头行业的贡献! 001机电工程学院 002信息与通信学院 003计算机与信息安全学院 004艺术与设计学院 005商学院 006外国语学院 007数学与计算科学学院 008电子工程与自动化学院 010材料科学与工程学院 011马克思主义学院 015建筑与交通工程学院

2018-10-22

人工智能白皮书-最新信通院整理2018-9月

感谢深圳新丰收教育科技有限公司分享人工智能白皮书,内容真实完整。 新丰收,全名深圳新丰收教育科技有限公司,成立于2016.12月,总部位于深圳市宝安区,是规模较大的行业培训和技能培训的综合性培训公司。自成立以来一直秉承“资源整合,服务你我”的企业遵旨,依托职业技能培训,职业规划培训和团队建设培训三大业务板块,让每一个客户都能享受到互联网+和大数据+带来的便利,同时整合团队内部不同领域不同行业的人脉资源,打造全新的猎聘生态和职场生态。公司核心团队均来自BAT等国内外大公司,一部分精英还来自FACEBOOK,GOOGLE,APPLE等顶尖公司。希望我们卓越的团队能为您提供高效满意的服务。 讲师:天一色团队 感谢深圳新丰收教育科技有限公司对猎头行业的贡献!

2018-09-29

人机交互新场景的 12 个新机会报告暨 WARE 2018 大会回顾

感谢深圳新丰收教育科技有限公司分享WARE2018大会报告,内容真实完整。 机会 1 人机交互前沿技术:现有人机交互界面技术的创新应用,将为用户带来语音 AI 的沉浸式体验(Saleel wsare / Synaptics) 机会 2 手机上的 AI:用设备和场景倒推 AI 技术进步,智能⼿机+IoT 是 AI 的⽆限生态(崔宝秋 / ⼩米) 机会 3 语音智能家居:当产品被越来越多消费者接受的时候,可以让语音植⼊到更多不同形态的设备中(Vic Shen / Google) 机会 4 音频产品的进化:大公司跑马圈地、教育市场,我们这样的⼩创业团队,只要做好差异化应用,才可能有我们未来的机会(曾德钧 / 猫王) 机会 5 儿童 AI 交互:AI 天然自带一种⼈格属性,它就是一个有生命的机器人(郭家 / 图灵机器人) 机会 6 儿童 AI 手表:孩⼦跟手表聊天,不会觉得跟一个机器人聊天,而是手表里面住着一个小宠物,这个小宠物懂他(孙浩 / 360) 机会 7 语音智能家居:对于配套的语⾳智控产品,可以选择为每个语音平台提供服务支持,实现不站队,跟每个大生态共生共舞(谢哲 / 酷宅) 机会 8 客厅 AI:AI 和内容服务落地家庭客厅场景,传统企业有着区别于互联网的考虑(陈懿林 / 创维) 机会 9 智能音箱:智能音箱是一个纯粹的网络产品,不是一件孤立的硬件产品,而是生态、内容和服务紧密结合的产品(唐立华 / 全志科技) 机会 10 语音交互耳机:每个人都需要⼀个贴心的 AI 助理,语音交互耳机⽐比音箱更有未来(⾼岩 / Anker) 机会 11 音频产品的变革:未来将会是能实现全场景应用、具备个性化内容及服务生态的 AI 便携设备占主导(陈亮 / 佳禾智能) 机会 12 翻译机:出境旅游是 AI 翻译技术一个核心的应用场景,而用户的需求聚焦在听得懂及看得懂两个层面(吴滔 / 搜狗) 新丰收,全名深圳新丰收教育科技有限公司,成立于2016.12月,总部位于深圳市宝安区,是规模较大的行业培训和技能培训的综合性培训公司。自成立以来一直秉承“资源整合,服务你我”的企业遵旨,依托职业技能培训,职业规划培训和团队建设培训三大业务板块,让每一个客户都能享受到互联网+和大数据+带来的便利,同时整合团队内部不同领域不同行业的人脉资源,打造全新的猎聘生态和职场生态。公司核心团队均来自BAT等国内外大公司,一部分精英还来自FACEBOOK,GOOGLE,APPLE等顶尖公司。希望我们卓越的团队能为您提供高效满意的服务。 讲师:天一色团队 感谢深圳新丰收教育科技有限公司对猎头行业的贡献!

2018-06-22

AAC转PCM工具包(python批处理)

感谢深圳新丰收教育科技有限公司分享AAC2PCM语音编解码转换格式工具,内容真实完整且简单易用。 /**************************************************************************************/ * AAC2PCM TOOL Function:AAC2PCM TOOL author:*** Date:2017-11-23 * ***************************************************************************************/ /*****************************************STEPS:****************************************/ /*1.Modify filepath and filelog path in aac2pcm.py file*/ /*2.Run command.bat*/ /*3.Run aac2pcm.py */ /*****************************************END:****************************************/ /*****************************************NOTE:****************************************/ /*1.Speech signal is 16bits and one channel*/ /*****************************************END:****************************************/ 感谢深圳新丰收教育科技有限公司。

2018-06-14

语音分割_语音质量客观打分工具(mos_pesq)

# MOS-PESQ The project is a tool that can get MOS(PESQ) score for the voice. PESQ measure: ------------- Usage of the PESQ objective measure is as follows: [pesq_mos]=pesq(cleanfile.wav,enhanced.wav) where 'cleanfile.wav' contains the clean speech file and 'enhanced.wav' contains the enhanced file. Example: To run the PESQ objective measure with the example files provided, type in MATLAB: >> pesq('sp09.wav','enhanced_logmmse.wav') ans = 2.2557 Source code for the PESQ implementation is available from a CD-ROM included in the following book: Loizou, P. (2007) "Speech enhancement: Theory and Practice", CRC Press. COMPOSITE MEASURE: ----------------- Usage: [Csig,Cbak,Covl]=composite(cleanfile.wav,enhanced.wav) where 'Csig' is the predicted rating of speech distortion 'Cbak' is the predicted rating of background distortion 'Covl' is the predicted rating of overall quality. You may run example files included in the zip file. In MATLAB, type: >> [c,b,o]=composite('sp09.wav','enhanced_logmmse.wav') LLR=0.681368 SNRseg=3.991727 WSS=49.671978 PESQ=2.255732 c = 3.3050 b = 2.6160 o = 2.7133 where 'sp09.wav' is the clean file and 'enhanced_logmmse.wav' is the enhanced file. The predicted ratings for overall quality was 2.7133, for background was 2.61 and for signal distortion it was 3.3050. Operating steps: ----------------- >> ./matlab-PESQ/readme.txt Thank: ----------------- Any questions, please E_mail: [email protected]/[email protected] 操作步骤 1.将所录序列加载如当前工作路径,也可以按自己工作路径自行加载; 2.在read.m中修改参考序列,默认为ref.wav,16KHz采样; 3.利用wavdivide.m对所录多组序列文件进行拆分(支持多种采样频率),并按序保证至当前路径; 4.运行tongji.m计算PESQ_MOS得分并通过excel/txt输出至指定路径; NOTE: 对于步骤4,每次执行记得修改excel中输出列位置,如cellnames2=['B',num2str(k+1),':B',num2str(k+1)];, 指定写入B列,下次执行改为C列,以此类推; 其中ref_8k.wav为8KHz采样测试序列,ref.wav为16KHz,ref_3s.wav只是为方便测试在ref.wav语音前加3s静音;

2018-06-14

中国共享经济发展报告(2017-2018)

感谢深圳新丰收教育科技有限公司分享由电子商务研究中心撰写的《中国共享经济发展报告》,内容真实完整。 核心观点: l 2017共享经济行业存在商业模式不清晰、资源掌控能力不足、行业同质化现象严重等难点。 l 共享经济中,信用体系将成为共享经济的重要工具,促进共享经济的健康发展。监管的步伐逐渐跟上, 相关政策的逐步出台。平台的发展由之前得无序发展走向规范化发展。国内市场发展到一定程度,国 际化将成为各个共享经济平台的发展方向,将共享经济理念进一步升华。 l 共享汽车:网约车从追求用户数量转向追求服务质量、交通分享业务多元化、海外市场拓张加速、新 兴技术将赋能在线出行。 l 共享单车:呈现多元化以及专业化以及集中化的发展趋势。 l 共享房屋:90后、95后成为共享住宿的主流使用群体,且集中于一二线城市。个性化趋势明显,非标 住宿成热潮,海外扩张成趋势。 l 共享金融:各地网贷平台备案逐步落地,优质资产端争夺加剧,大数据等技术将提升平台风控水平。 l 共享知识技能:垂直细分领域成为知识付费未来发展方向。 新丰收,全名深圳新丰收教育科技有限公司,成立于2016.12月,总部位于深圳市宝安区,是规模较大的行业培训和技能培训的综合性培训公司。自成立以来一直秉承“资源整合,服务你我”的企业遵旨,依托职业技能培训,职业规划培训和团队建设培训三大业务板块,让每一个客户都能享受到互联网+和大数据+带来的便利,同时整合团队内部不同领域不同行业的人脉资源,打造全新的猎聘生态和职场生态。公司核心团队均来自BAT等国内外大公司,一部分精英还来自FACEBOOK,GOOGLE,APPLE等顶尖公司。希望我们卓越的团队能为您提供高效满意的服务。 感谢深圳新丰收教育科技有限公司对该行业的贡献!

2018-06-04

HTK中文版详细教程(最新版)

1 HTK基础 1.1 HMM基本原理 1.2 孤立词识别 1.3 输出概率说明 1.4 Baum-Welch Re-Estimation 1.5 识别和Viterbi解码 1.6 连续语音识别 1.7 说话者适应 2 HTK工具包概览 2.1 HTK软件架构 2.2 HTK工具的一般属性 2.3 工具包 2.3.1 数据准备工具 2.3.2 训练工具 2.3.3 识别工具 2.3.4 分析工具 2.4 版本3.4中的更新 2.4.1 版本3.3中的更新 2.4.2 版本3.2中的更新 2.4.3 版本3.1中的更新 2.4.4 版本2.2中的更新 2.4.5 版本2.1中的新特征 3 一个教程示例 3.1 数据准备 3.1.1 步骤一 任务语法 3.1.2 步骤二 字典 3.1.3 步骤三 录制语音数据 3.1.4 步骤四 创建脚本文件 3.1.5 步骤五 语音数据编码 3.2 创建单元音HMM 3.2.1 步骤六 创建Flat start单元音 3.2.2 步骤七 确定Silence模型 3.2.3 步骤八 Realigning训练数据 3.3 创建Tied-Stated三元音 3.3.1 步骤九 从单元音创建三元音 3.3.2 步骤十 创建Tied-Stated三元音 3.4 识别器评估 3.4.1 步骤十一 识别测试数据 3.5 运行识别器 3.6 HMM自适应 3.6.1 步骤十二 准备自适应数据 3.6.2 步骤十三 生成Transforms(转移矩阵) 3.6.3 自适应系统评估 3.7 Semi-Stated和HLDA Transform 3.8 总结

2018-05-18

人工智能标准化白皮书(2018最新版)

感谢深圳新丰收教育科技有限公司分享由中国电子技术标准化研究院撰写的《人工智能标准化白皮书2018版》,内容真实完整。 目录 1 前言 ....................................................................1 1.1 研究背景 ............................................................1 1.2 研究目标及意义 ......................................................2 2 人工智能概述 ............................................................3 2.1 人工智能的历史及概念 ................................................3 2.1.1 人工智能的起源与历史 .............................................3 2.1.2 人工智能的概念 ...................................................5 2.2 人工智能的特征 ......................................................7 2.3 人工智能参考框架 ....................................................8 3 人工智能发展现状及趋势 .................................................11 3.1 人工智能关键技术 ...................................................11 3.1.1 机器学习 ........................................................11 3.1.2 知识图谱 ........................................................13 3.1.3 自然语言处理 ....................................................14 3.1.4 人机交互 ........................................................15 3.1.5 计算机视觉 ......................................................17 3.1.6 生物特征识别 ....................................................19 3.1.7 虚拟现实/增强现实 ...............................................21 3.1.8 人工智能技术发展趋势 ............................................21 3.2 人工智能产业现状及趋势 .............................................22 3.2.1 智能基础设施 ....................................................23 3.2.2 智能信息及数据 ..................................................24 3.2.3 智能技术服务 ....................................................25 3.2.4 智能产品 ........................................................25 3.2.5 人工智能行业应用 ................................................27 3.2.6 人工智能产业发展趋势 ............................................31 3.3 安全、伦理、隐私问题 ...............................................32 3.3.1 人工智能的安全问题 ..............................................32 3.3.2 人工智能的伦理问题 ..............................................33 3.3.3 人工智能的隐私问题 ..............................................34 3.4 人工智能标准化的重要作用 ...........................................35 4 人工智能标准化现状 .....................................................37 4.1 国际标准化现状 .....................................................37 4.1.1 ISO/IEC JTC 1 ..................................................37 4.1.2 ISO ............................................................40 4.1.3 IEC ............................................................40 4.1.4 ITU ............................................................41 4.2 国外标准化现状 .....................................................41 4.2.1 IEEE ...........................................................41 4.2.2 NIST ...........................................................41 4.2.3 其它 ...........................................................42 4.3 国内标准化现状 .....................................................42 4.3.1 全国信息技术标准化技术委员会 ....................................42 4.3.2 全国自动化系统与集成标准化技术委员会 ............................43 4.3.3 全国音频、视频和多媒体标准化技术委员会 ..........................43 4.3.4 全国信息安全标准化技术委员会 ....................................43 4.3.5 全国智能运输系统标准化技术委员会 ................................44 4.4 人工智能标准化面临的问题和挑战 .....................................44 4.5 人工智能标准需求分析 ...............................................45 4.6 人工智能标准化组织机制建设 .........................................46 5 人工智能标准体系 .......................................................48 5.1 人工智能标准体系结构 ...............................................48 5.2 标准体系框架 .......................................................49 5.2.1 基础标准 ........................................................51 5.2.2 平台/支撑标准 ...................................................51 5.2.3 关键技术标准 ....................................................51 5.2.4 产品及服务标准 ..................................................53 5.2.5 应用标准 ........................................................54 5.2.6 安全/伦理标准 ...................................................56 5.3 近期急需制定标准 ...................................................56 6 人工智能标准化工作重点建议 .............................................59 附件 1 人工智能标准明细表 ................................................61 附件 2 应用案例 ..........................................................71

2018-05-18

人工智能相关领域算法职位猎头必备知识(精简版上册-深圳新丰收教育科技有限公司出品)

AI行业猎头必备知识汇总 第一部分:基础知识 1.1 信号与系统相关知识 1.2 数字信号处理相关知识 1.3 通信原理与微电子相关知识 1.4 计算机网络及开发相关知识 1.5 深度学习与模式识别相关知识 1.6 软件理论与编程语言相关知识 第二部分:应用场景 2.1声音行业 2.1.1 声学(智能音箱,智能家居) 2.1.2 语音(语音识别,语音合成,VOIP) 2.1.3 音乐(变音,音效,版权) 2.1.4 语言及综合 (智能机器人,智能客服,NLP) 2.2视频行业 2.2.1 电视类,录播类 (4K纯屏,H265) 2.2.2 实时通信类(带宽,资源,质量) 2.2.3 流媒体互动直播、直播(连麦,监管) 2.2.4 综合业务(在线抓娃娃,软硬件结合) 2.3 图像行业 2.3.1 卫星,雷达,地勘图像类 2.3.2 医学,显微镜图像类 2.3.3 人脸,手势,物体识别类 2.3.4 无人驾驶,智能交通类 2.3.5 智能搜索综合类 第三部分:行业发展探讨与分享 3.1 大数据 3.2 云计算 3.3 分布式 3.4 区块链 3.5 深度学习 3.6 微电子、智能硬件 3.7 AI 第四部分:总结 新丰收,全名深圳新丰收教育科技有限公司,成立于2016.12月,总部位于深圳市宝安区,是规模较大的行业培训和技能培训的综合性培训公司。自成立以来一直秉承“资源整合,服务你我”的企业遵旨,依托职业技能培训,职业规划培训和团队建设培训三大业务板块,让每一个客户都能享受到互联网+和大数据+带来的便利,同时整合团队内部不同领域不同行业的人脉资源,打造全新的猎聘生态和职场生态。公司核心团队均来自BAT等国内外大公司,一部分精英还来自FACEBOOK,GOOGLE,APPLE等顶尖公司。希望我们卓越的团队能为您提供高效满意的服务。 讲师:天一色团队 感谢深圳新丰收教育科技有限公司对猎头行业的贡献!

2018-05-09

高数-概率-线代-矩阵分析-随机过程(深度学习基础知识)

2011年李永乐线性代数辅导讲义全.pdf 《概率、随机变量与随机过程》美_A·帕普里斯(A._Papoulis).pdf 同济高等数学第六版上、下册 全.pdf 矩阵分析(第三版 史荣昌).pdf 线性代数教材(同济五版+学习辅导与习题全解).pdf 高等数学教材(免费下载)-2.pdf

2018-05-09

webrtc2017全球技术峰会所有大牛ppt

天一色科技: 米谟科技_RTC2017.pdf 棋牌游戏本地化挑战与机遇.pptx 何丰-质量实时监控-声网Agora全球音视频实时传输的关键帧0915.pdf test.bat 刘明灵-直播海外破冰.pdf 泛娱乐白皮书-猎豹全球智库.pdf RTC在规模直播场景下的技术分析.pdf 泛娱乐场景下的实时音视频技术解析-陈若非.pptx AMG2.0 手游棋牌的实时音视频新体验-陈若非_Final.pptx 高泽华-面向不可靠传输网络的抗丢包编解码器v2.pdf 好未来-直播的演进与应用 .pdf 视频社交 开PA的实时视频技术应用.pptx 浅谈棋牌行业的投资并购-耀吉资本.pdf 陈功-网页端实时音视频架构与实践(1)副本.pdf 视频编码未来简史-马思伟.pdf

2018-05-09

天一色科技—AI+应用于垂直领域,如何改善这八大行业2018.5

天一色科技—AI+应用于垂直领域,如何改善这八大行业,医疗,教育,交通等行业在AI的加持下会有怎样的新趋势?此内容从一一为你解答。

2018-05-09

语音信号处理基础知识汇总-共12 章ppt

《数字语音编码》讲义 同济大学电子与信息工程学院 赵晓群 编著 机械工业出版社,2017年

2018-05-09

视觉机器学习20讲原版影印书和源代码matlab.rar

《视觉机器学习20讲》是计算机、自动化、信息、电子与通信学科方向的专著,详尽地介绍了K-Means、KNN学习、回归学习、决策树学习、Random Forest、贝叶斯学习、EM算法、 Adaboost、SVM方法、增强学习、流形学习、RBF学习、稀疏表示、字典学习、BP学习、CNN学习、RBM学习、深度学习、遗传算法、蚁群方法等基本理论;深入阐述了视觉机器学习算法的优化方法和实验仿真;系统地总结了其优点和不足。 本书特别重视如何将视觉机器学习算法的理论和实践有机地结合,解决视觉机器学习领域中的诸多基础问题,可应用于医学图像分析、工业自动化、机器人、无人车、人脸检测与识别、车辆信息识别、行为检测与识别、智能视频监控等。本书特别重视算法的典型性和可实现性,既包含本领域的经典算法,也包含本领域的最新研究成果。 本代码包括了视觉机器学习20讲的20课程源代码,非常详细的进行了实现,具有非常高的学习价值。

2018-05-09

泛娱乐社交发展现状,技术和入局公司分析

泛娱乐社交发展现状,技术和入局公司分析: 排名 app 周活跃渗透率及变化 排名变化 背后的公司/投资方 1 虎牙游戏直播 0.6842% +1 欢聚时代 2 YY直播 0.5198% +1 欢聚时代 3 斗鱼直播 0.5142% +1 腾讯投资 4 企鹅电竞 0.4809% +15 腾讯产品 5 触手直播 0.3054% +1 纪源资本GGV等 6 映客 0.2401% -5 宣亚国际 7 熊猫直播 0.2082% - 王思聪 8 Now直播 0.1778% +7 腾讯产品 9 一直播 0.1583% +7 一下科技、新浪 10 花椒 0.1573% -1 360 11 咪咕直播 0.1555% -1 中国移动 12 小米直播 0.1101% -7 小米 13 龙珠直播 0.1030% -2 苏宁 14 人人 0.0720% -1 上市公司 15 酷狗直播 0.0665% -3 酷狗 注: 1. 排行榜依据周活跃渗透率(周活跃渗透率=app的周活跃用户数/中国市场总周活跃用户数);包括直播功能的其它分类App如陌陌、快手,体育类App、纯电视直播不包括在排行榜中。 2.数据周期:截至2017.7.31;涨跌情况、排名变化为对比2016.10.2的数据 排名 app 周活跃渗透率 1 映客 0.6615% 2 虎牙游戏直播 0.6129% 3 YY 0.6099% 4 斗鱼TV 0.5351% 5 小米直播 0.3453% 6 触手直播 0.2946% 7 熊猫直播 0.2487% 8 视吧 0.2230% 9 花椒 0.2096% 10 咪咕直播 0.1639% 11 龙珠直播 0.1582% 12 酷狗直播 0.1477% 13 人人 0.1435% 14 全民直播 0.1135% 15 NOW直播 0.1068% 2016.9.26~2016.10.2 2017.8.1~2017.8.7 一年过去……中国直播app排行榜与一年前变化

2018-05-09

AI行业应用价值报告

人工智能行业应用价值报告,详细说明了: AI概述 1. 研究范围 2. 行业现处发展阶段 3. 技术应用价值 4. 企业每年成立及地域分布情况 5. 投融资情况 2 3 AI赋能行业发展现状 1. AI医疗 2. AI教育 3. AI制造 4. AI其他 5. 应用领域发展现状总结 AI发展趋势 1. 宏观:AI发展大势 2. 微观:业内希冀

2018-05-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除