自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(91)
  • 资源 (4)
  • 收藏
  • 关注

原创 语音识别数据准备

查看目录下有多少个数据:ls /home/…/ | wc -l查看某个txt的具体内容:ls /home/…/*.txt | head -n 10用file命令查看编码格式是否是utf-8:file /home/…/*.txt查看txt有多少行:wc -l /home/…/*.txtwav.scp:[wav-id][wav-path]生成绝对路径:用find找出所有的绝对路径:find /home/…/ios/wav -iname ‘*.wav’ | head -n 1...

2021-04-23 08:21:34 741

原创 语音增强改进方法总结

1、模型更复杂Mel frequency power spectrum (MFP) was used for speech enhancement in INTERSPEECH 2013 :https://bio-asplab.citi.sinica.edu.tw/paper/conference/lu2013speech.pdfConvolutional maxout neural networks for speech separation:https://ieeexplore.ieee.org/

2021-03-22 20:17:33 783

原创 github问题记录

push failed:参考https://blog.csdn.net/u013977285/article/details/79726354

2021-03-21 18:24:06 198

原创 阅读笔记:基于深层神经网络的语音增强方法(一)

论文:徐勇. (2015). 基于深层神经网络的语音增强方法研究. (Doctoral dissertation).贡献传统语音增强根据前面帧估计噪声,在非平稳噪声的情况下,跟踪和估计噪声的策略失效,同时,为了推导方便,进行了对数据分布的高斯性假设是不合理的,限制了传统算法的上限。基于有监督的语音增强算法,例如浅层人工神经网络的语音增强,受自身规模和数据量的限制,对于不匹配噪声泛化性差。HMM和非负矩阵分解的方法,架设了噪声和语音之间的独立性,限制了语音增强的性能。近年来基于深度学习的语音增强算法,

2021-03-11 17:26:45 2873 1

原创 MOCKINGJAY: UNSUPERVISED SPEECH REPRESENTATION LEARNING WITH DEEP BIDIRECTIONAL TRANSFORMER ENCODERS

文章:MOCKINGJAY: UNSUPERVISED SPEECH REPRESENTATION LEARNING WITH DEEP BIDIRECTIONAL TRANSFORMER ENCODERS作者:Andy T. Liu Shu-wen Yang Po-Han Chi Po-chun Hsu Hung-yi LeeNational Taiwan UniversityGitHub:https://github.com/andi611/Self-Supervised-Speech-Pretr

2020-09-07 15:51:47 946

原创 (IS 15)Convolutional Neural Networks for Small-footprint Keyword Spotting

会议:INTERSPEECH 2015论文:Convolutional Neural Networks for Small-footprint Keyword Spotting作者:Tara N. Sainath, Carolina ParadaAbstract我们探索使用卷积神经网络(CNN)进行小尺寸关键字发现(KWS)任务。 CNN对于KWS具有吸引力,因为它在参数方面要远远优于DN...

2020-05-07 07:54:07 663

原创 (IS 19)On Learning Interpretable CNNs with Parametric Modulated Kernel-based Filters

会议:INTERSPEECH 2019论文:On Learning Interpretable CNNs with Parametric Modulated Kernel-based Filters(基于参数调制的基于核的滤波器学习可解释的CNN)作者:Erfan Loweimi, Peter Bell, Steve RenalsAbstract我们研究了在卷积神经网络(CNN)框架中使用...

2020-04-18 11:17:14 455

原创 (IS 19)Feature exploration for almost zero-resource ASR-free keyword spotting using a multilingual b

会议:INTERSPEECH 2019论文:Feature exploration for almost zero-resource ASR-free keyword spotting using a multilingual bottleneck extractor and correspondence autoencoders作者:Raghav Menon, Herman Kamper, ...

2020-04-18 11:01:20 403

原创 (IS 19)Automatic Detection of Prosodic Focus in American English

会议:INTERSPEECH 2019论文:Automatic Detection of Prosodic Focus in American English作者:Sunghye Cho, Mark Liberman, Yong-cheol LeeAbstract焦点通常由韵律的突出来调节,突出强调句子中的特定元素以进行强调或对比。尽管它在交流中很重要,但在语音识别领域却很少受到关注。本文...

2020-04-16 08:08:36 401

原创 (IS 19)wav2vec: Unsupervised Pre-training for Speech Recognition

会议:INTERSPEECH 2019论文:wav2vec: Unsupervised Pre-training for Speech Recognition作者:Steffen Schneider, Alexei Baevski, Ronan Collobert, Michael AuliAbstract我们通过学习原始音频的表示,探索语音识别的无监督预训练。 在大量未标记的音频数据上对...

2020-04-15 18:03:25 3395

原创 (IS 19)Binary Speech Features for Keyword Spotting Tasks Alexandre Riviello, Jean-Pierre David(重点)

会议:INTERSPEECH 2019论文:Binary Speech Features for Keyword Spotting TasksAlexandre Riviello, Jean-Pierre David作者:Alexandre Riviello, Jean-Pierre DavidAbstract关键字发现是一项分类任务,旨在检测一组特定的口语单词。 通常,此类任务在功耗受...

2020-04-15 08:10:23 414

原创 (IS 19)Low-Dimensional Bottleneck Features for On-Device Continuous Speech Recognition

会议:INTERSPEECH 2019论文:Low-Dimensional Bottleneck Features for On-Device Continuous Speech Recognition作者:David B. Ramsay, Kevin Kilgour, Dominik Roblek, Matthew SharifiAbstract低功耗数字信号处理器(DSP)通常具有非常...

2020-04-13 09:55:51 297

原创 (IS 19)Unsupervised Raw Waveform Representation Learning for ASR

会议:INTERSPEECH 2019论文:Unsupervised Raw Waveform Representation Learning for ASR作者:Purvi Agrawal, Sriram GanapathyAbstract在本文中,我们提出了一种在无监督学习范例中使用原始语音波形的深度表示学习方法。提出的深度模型的第一层执行声学滤波,而随后的一层执行调制滤波。使用学习其...

2020-04-08 16:50:50 478

原创 你走的路,每一步都算数

New York is 3 hours ahead of Californiabut it does not make California slowSomeone graduated at the age of 22but waited 5 years before securing a good job!Someone became a CEO at 25and died at 50...

2020-04-08 16:39:18 412

原创 (IS 19)Prosody Usage Optimization for Children Speech Recognition with Zero Resource Children Speech

会议:INTERSPEECH 2019论文:Prosody Usage Optimization for Children Speech Recognition with Zero Resource Children Speech作者:Chenda Li, Yanmin QianAbstract儿童语音识别仍然是自动语音识别的一大挑战。由于处理过程更加困难且数据收集成本较高,因此大多数当前...

2020-04-03 08:20:52 354

原创 (IS 19)Modulation Vectors as Robust Feature Representation for ASR in Domain Mismatched Conditions

会议:INTERSPEECH 2019论文:Modulation Vectors as Robust Feature Representation for ASR in Domain Mismatched Conditions作者:Samik Sadhu, Hynek HermanskyAbstract在这项工作中,我们在自动语音识别(ASR)系统中的训练和测试条件之间的域不匹配中,证明了...

2020-04-03 07:48:33 377

原创 论文笔记 - 《Deep Learning》(Yann LeCun Yoshua Bengio & Geoffrey Hinton)经典

论文: LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton. “Deep learning.” Nature 521.7553 (2015): 436-444. [pdf] (Three Giants’ Survey)监督学习机器学习最常见的形式,不管是否深入都是监督学习。我们计算一个目标函数,它度量输出分数与期望的分数模式之间的误差(距离)。然...

2020-03-24 16:18:07 2303

原创 论文笔记 - 《A Fast Learning Algorithm for Deep Belief Net》---深度学习前夕

Hinton, Geoffrey E., Simon Osindero, and Yee-Whye Teh. “A fast learning algorithm for deep belief nets.” Neural computation 18.7 (2006): 1527-1554. [pdf](Deep Learning Eve)作者: G.E.Hinton et. al.日期: ...

2020-03-24 16:17:58 1089

原创 论文笔记 ​​​​​​​---语音关键词检测方法综述

概述相比于语音识别、语音合成、语音增强,说话人识别等常见语音领域,关键词检测相对来说比较小众,但随着智能助理、智能音箱等的兴起,关键词检测越来越受到产业界的 重视。语音关键词检测关注如何从连续语音流中检测出用户感兴趣的关键词。典型场景分为两类:1、语音设备控制: 根据用户指令来唤醒或者控制智能设备;2、语音检索: 从大段语音文档中定位到关键词所在位置。Keyword Spotting 指...

2020-03-24 16:17:45 2998

原创 (ICASSP 19)END-TO-END STREAMING KEYWORD SPOTTING

会议:ICASSP 2019论文:END-TO-END STREAMING KEYWORD SPOTTING作者:Raziel Alvarez, Hyun Jin Park, Google, Inc., United StatesABSTRACT  提出了一个关键词识别系统,除了用于特征生成的前端组件外,它完全包含在经过“端到端”训练的深度神经网络(DNN)模型中,用于预测音频流中关键词的...

2020-03-24 16:17:33 1395 1

原创 (INTERSPEECH 19)Full-Sentence Correlation: a Method to Handle Unpredictable Noise for Robust Speech

会议:INTERSPEECH 2019论文:Full-Sentence Correlation: a Method to Handle Unpredictable Noise for Robust Speech Recognition作者:Ji Ming, Danny CrookesAbstract  描述了用于语音识别的全句语音相关的理论和实现,并证明了它对未经训练/未经训练的噪声具有优...

2020-03-24 16:16:30 424

原创 学习笔记 - 《关键词唤醒和嵌入式系统》

摘自清华语音和语言技术中心KWS评价指标1)、唤醒率: 在测试过程中被系统正确唤醒的次数除以总的测试次数。2)、虚警率: 在测试过程中系统不被唤醒的次数除以总的测试次数。3)、实时率: 系统的反应速度。4)、功耗水平: 低功耗是系统性能的一个重要指标,与用户体验紧密相关。方法流程关键词唤醒分为两个阶段:检测阶段、决策阶段。第一个阶段:检测阶段。即系统手机关键词在给定的句子中的信息。...

2020-03-24 16:16:11 2610 2

原创 (IEEE Access7)Effective Combination of DenseNet and BiLSTM for Keyword Spotting

论文地址:Effective Combination of DenseNet and BiLSTM for Keyword Spotting发表于: IEEE Access ( 第7卷)发布日期: 2019年1月10日Abstract  在本文中,基于DenseNet提取本地特征图的强大功能,我们为KWS提出了一种新的网络体系结构(DenseNet-BiLSTM)。在我们的DenseNet...

2020-03-24 16:15:57 1171

原创 (ICASSP 19)Federated Learning for Keyword Spotting

会议: ICASSP 2019论文:Federated Learning for Keyword Spotting作者:David Leroy、Alice Coucke、Thibaut Lavril、Thibault Gisselbrecht、Joseph DureauABSTRACT提出了一种基于联合学习的实用方法,以通过连续运行基于嵌入式语音的模型(例如唤醒词检测器)来解决域外问题。我...

2020-03-24 16:14:56 985

原创 (ISCSLP 16)End-to-end keywords spotting based on connectionist temporal classification for Mandarin

会议:ISCSLP 2016论文:作者:

2020-03-24 16:14:40 908

原创 (ICACSIS 17)Contextual keyword spotting in lecture video with deep convolutional neural network

论文:Contextual keyword spotting in lecture video with deep convolutional neural network发表于: 2017年高级计算机科学与信息系统国际会议(ICACSIS)加入IEEE Xplore的日期: 2018年5月7日Abstract  介绍了使用深度卷积神经网络(CNN)架构的演讲视频关键字发现(KWS)系统。...

2020-03-24 16:14:23 540

原创 (ICASSP 19)EFFICIENT KEYWORD SPOTTING USING DILATED CONVOLUTIONS AND GATING

会议:ICASSP 2019论文:EFFICIENT KEYWORD SPOTTING USING DILATED CONVOLUTIONS AND GATING作者:Alice Coucke, Mohammed Chlieh, Thibault Gisselbrecht, David Leroy,Mathieu Poumeyrol, Thibaut LavrilABSTRACT我们探索...

2020-03-24 16:11:37 984 1

原创 (KWS-HMM)

会议:ICASSP-90论文:A HIDDEN MARKOV MODEL BASED KEYWORD RECOGNITION SYSTEM作者:Richard C Rose,Douglas B Paul

2020-03-24 16:11:21 757

原创 (ICASSP 2014)Small-footprint keyword spotting using deep neural networks

会议:ICASSP 2014论文:Small-footprint keyword spotting using deep neural networks作者:Guoguo Chen ; Carolina Parada ; Georg HeigoldAbstract我们的应用程序需要具有内存占用量小,计算成本低和精度高的关键字查找系统。为了满足这些要求,我们提出了一种基于深度神经网络的简单方...

2020-03-24 16:10:43 1500

原创 (KWS-LSTM)Max-pooling loss training of long short-term memory networks for small-footprint keyword s

会议:2016 IEEE口语技术研讨会(SLT)论文:Max-pooling loss training of long short-term memory networks for small-footprint keyword spotting作者: Ming Ming,Anirudh Raju,George Tucker,Sankaran Panchapagesan,Gengshen F...

2020-03-24 16:09:19 1384

原创 (ICASSP 18)Temporal Modeling Using Dilated Convolution and Gating for Voice-Activity-Detection

会议:ICASSP 2018论文:Temporal Modeling Using Dilated Convolution and Gating for Voice-Activity-Detection作者:Shuo-Yiin Chang, Bo Li, Gabor Simko, Tara N Sainath, Anshuman Tripathi, Aäron van den Oord, Ori...

2020-03-24 16:09:02 707

原创 (ICASSP 19)Hotword Cleaner: Dual-microphone Adaptive Noise Cancellation with Deferred Filter Coeffic

会议:ICASSP 2019论文:Hotword Cleaner: Dual-microphone Adaptive Noise Cancellation with Deferred Filter Coefficients for Robust Keyword Spotting作者:Yiteng Arden Huang ; Turaj Z. Shabestary ; Alexander Gru...

2020-03-24 16:08:42 744

原创 (ICASSP 19)VOICE TRIGGER DETECTION FROM LVCSR HYPOTHESIS LATTICES USING BIDIRECTIONAL LATTICE RECURR

会议:ICASSP 2019论文:VOICE TRIGGER DETECTION FROM LVCSR HYPOTHESIS LATTICES USINGBIDIRECTIONAL LATTICE RECURRENT NEURAL NETWORKS作者:Woojay Jeon ; Leo Liu ; Henry MasonABSTRACT我们提出了一种通过神经网络对服务器端大型词汇连续语...

2020-03-24 16:07:49 341

原创 (ICASSP 19)ADVERSARIAL EXAMPLES FOR IMPROVING END-TO-END ATTENTION-BASED SMALL-FOOTPRINT KEYWORD SPO

会议:ICASSP 2019论文:ADVERSARIAL EXAMPLES FOR IMPROVING END-TO-END ATTENTION-BASED SMALL-FOOTPRINT KEYWORD SPOTTING作者:Xiong Wang ; Sining Sun ; Changhao Shan ; Jingyong Hou ; Lei Xie ; Shen Li ; Xin Lei...

2020-03-24 16:07:31 464

原创 (ICASSP 19)FOCAL LOSS AND DOUBLE-EDGE-TRIGGERED DETECTOR FOR ROBUST SMALL-FOOTPRINT KEYWORD SPOTTING

会议:ICASSP 2019论文:FOCAL LOSS AND DOUBLE-EDGE-TRIGGERED DETECTOR FOR ROBUST SMALL-FOOTPRINT KEYWORD SPOTTING作者:Bin Liu ; Shuai Nie ; Yaping Zhang ; Shan Liang ; Zhanlei Yang ; Wenju LiuABSTRACT关键词识别...

2020-03-24 16:06:53 742

原创 (ICASSP 19)SEMI-SUPERVISED AND POPULATION BASED TRAINING FOR VOICE COMMANDS(Speech Commands Dataset)

会议:ICASSP 2019论文:SEMI-SUPERVISED AND POPULATION BASED TRAINING FOR VOICE COMMANDS RECOGNITION作者:Oguz H. Elibol ; Gokce Keskin ; Anil ThomasAbstract提出了一种将超参数自动调整与半监督训练相结合的快速设计方法,建立了高精度、鲁棒的语音命令分类模型。...

2020-03-24 16:06:34 735

原创 (ICASSP 19)AUTOMATIC GRAMMAR AUGMENTATION FOR ROBUST VOICE COMMAND RECOGNITION

会议:ICASSP 2019论文:作者:

2020-03-24 16:06:07 558

原创 (ICASSP 19)Streaming End-to-end Speech Recognition for Mobile Devices

会议:ICASSP 2019论文:Streaming End-to-end Speech Recognition for Mobile Devices作者:Yanzhang He, Tara N. Sainath, Rohit Prabhavalkar, Ian McGraw, Raziel Alvarez, Ding Zhao, David Rybach, Anjuli Kannan, Yo...

2020-03-24 16:05:50 1802

原创 (ICASSP 18)DEEP RESIDUAL LEARNING FOR SMALL-FOOTPRINT KEYWORD SPOTTING(重点)

会议:ICASSP 2018论文:DEEP RESIDUAL LEARNING FOR SMALL-FOOTPRINT KEYWORD SPOTTING、链接2、GitHub作者:Raphael Tang ; Jimmy Lin

2020-03-24 16:05:08 1305

原创 (2017)Honk: A PyTorch Reimplementation of Convolutional Neural Networks for Keyword Spotting

论文:Honk: A PyTorch Reimplementation of Convolutional Neural Networks for Keyword Spotting作者:Raphael Tang, Jimmy LinABSTRACT我们描述了Honk,这是TensorFlow示例中包含的用于关键字识别的卷积神经网络的开源PyTorch重新实现。 这些模型对于识别基于语音的界面(...

2020-03-24 16:04:52 645

简洁扁平化商务汇报.pptx

简洁扁平化商务汇报,圆形、椭圆形、圆角长方形、三角形等形状创意,低面背景,简约扁平化淡雅蓝商务工作汇报ppt模板

2017-12-24

nutz框架jar包

nutz-1.r.62.jar、druid-1.0.26.jar、gson-2.8.0.jar、javase-3.2.1.jar、jstl.jar、mysql-connector-java-5.1.26-bin.jar、standard.jar

2017-12-24

Java 书籍管理系统

使用Java语言编码实现一个书籍管理程序,要求如下: 可以完成书籍信息的添加、删除功能。书籍信息包含书号、书名、作者、出版日期、价格、数量,采用类定义。在系统运行前和系统关闭后,书籍信息永久存储在文件中,系统启动后,书籍信息从文件加载到内存的链表中,通过链表操作书籍。可以使用Java自带的容器类如List。 1、 创建书籍类和相关方法(20分)。 2、 通过图形界面实现书籍信息录入,书籍信息存储在文件中。(30分) 3、 通过图形界面实现按书号删除图书功能(20分) 4、 对书籍数量按作者统计并用折线图或者饼图显示出来。(15分) 5、 系统代码要求规范、正确,有必要的注释,避免内存泄漏问题出现。(15分) 注意:出现代码雷同一律按零分计!

2017-11-16

Java SuperVCD

SuperVCD Store是一个用纯Java技术开发的音乐及视频光盘销售系统。它由两部分组成: 前端光盘查询,及后端数据采集和传输。其中光盘查询模块提供了基于Swing技术的可视化图形界面,用户可以搜索要找的光盘类别,查看光盘的详细信息等等;数据采集和接收模块则负责读取光盘数据文件,并通过基于网络和多线程技术的机制传输数据。.

2017-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除