凌逆战的博客

CSDN的所有文章均转载自我博客园的文章，由于转载存在丢失，想了解细节，可访问我的博客园。https://www.cnblogs.com/LXP-Never/

原创本博客文章来源说明

该CSDN账号会自动转载我“博客园”的文章，但是在转载的过程中，内容会出现丢失，导致不健全，内容不完整，所以我建议对我文章感兴趣的朋友可以访问我的“博客园”，内容更加丰富，更新更快。“博客园”地址https://www.cnblogs.com/LXP-Never/...

2018-12-12 01:30:01 495

原创如何快速了解一个行业

那么作为门外汉，如何快速了解一个行业。可以从四个层面系统性地去了解1、行业了解的目的一般来说，从企业角度出发做行业分析的目的通常有三个：了解所属行业的发展现状、竞争优劣、行业前景等，现在这个行业里竞争环境如何。挖掘行业机会点，明确优势，看清劣势，寻找与领先企业的差距，改善资源配置，扬长避短。分析市场产品布局，找到企业产品层面的突破，为新产品做行业调研、市场分析、行业的发展动态，竞品...

2024-02-15 12:27:00 717

原创论文阅读：2023_Semantic Hearing: Programming Acoustic Scenes with Binaural Hearables

论文地址：语义听觉:用双耳可听器编程声学场景论文代码：https://semantichearing.cs.washington.edu/引用格式：Veluri B, Itani M, Chan J, et al. Semantic Hearing: Programming Acoustic Scenes with Binaural Hearables[C]//Proceedings of ...

2023-12-06 11:19:00 389

原创 Linux后台跑程序的方法总结

当使用ssh进行远程代码运行时，控制端电脑通常不能出现任何意外。然而，运行深度学习程序通常需要数小时或数天的时间，这意味着我们的IDE不能关闭。一旦出现非人为因素(如断电、断网或IDE卡死关闭)，远程程序也会中断。因此，将程序灵活地运行在服务器上，不受控制端因素的影响至关重要。第一种方法: &第一种方法是在命令行最后加&符号# 执行文件./test.py & ...

2023-12-04 17:06:00 235 2

原创 anker创新-2023年秋季校园招聘-音频算法方向

安克创新音频团队招聘了

2023-11-08 10:47:06 353

原创安克创新音频算法工程师(应届生)招聘

负责音频处理算法的研发和优化，包括但不限于噪声抑制、回声消除、声反馈抑制、音效、声纹、唤醒、指令词识别等。对音频处理系统进行模拟和实验，验证算法的性能，参与音频算法的性能评估和调试，解决实际应用中的问题。在音频信号处理、唤醒、关键词、声纹、声学事件检测一个或多个方向有较深入研究。熟练掌握C、Python、Shell等编程语言，熟悉常用的深度学习框架。好的团队协作精神，较强的沟通能力以及英文读写能力，对技术研发有热情。信号处理、计算机、电子信息、自动化等相关专业硕士及以上学历。

2023-11-08 10:04:01 327

原创 EQ 均衡器

EQ 的全称是 Equalizer，EQ 是 Equalizer 的前两个字母，中文名字叫做“均衡器”。最早是用来提升电话信号在长距离的传输中损失的高频，由此得到一个各频带相对平衡的结果，它让各个频带的声音得到了均衡。。

2023-10-06 23:12:33 1558

原创论文翻译：2021_Real-Time Denoising and Dereverberation wtih Tiny Recurrent U-Net

论文地址：微型循环U-Net实时降噪和去混响论文代码：https://github.com/YangangCao/TRUNethttps://github.com/amirpashamobinitehrani/tinyrecurrentunet引用格式：Choi H S, Park S, Lee J H, et al. Real-Time Denoising and Derever...

2023-06-26 15:27:00 1069

原创如何跟踪语音领域的技术

语音顶会ICASSP 所有年份论文集下载地址：https://ieeexplore.ieee.org/xpl/conhome/1000002/all-proceedingsInterspeech 所有年份论文集下载地址：https://www.isca-speech.org/archive/期刊IEEE Transactions on Audio, Speech and Language...

2023-03-24 14:25:00 943 1

原创论文翻译：2023_THLNet: two-stage heterogeneous lightweight network for monaural speech enhancement...

论文地址：THLNet: 用于单耳语音增强的两级异构轻量级网络代码：https://github.com/dangf15/THLNet引用格式：Dang F, Hu Q, Zhang P. THLNet: two-stage heterogeneous lightweight network for monaural speech enhancement[J]. arXiv preprint...

2023-03-21 14:19:00 1124

原创论文翻译：2022_Phase-Aware Deep Speech Enhancement: It’s All About The Frame Length

摘要　　虽然相位感知语音处理近年来受到越来越多的关注，但大多数帧长约为32 ms的窄带STFT方法显示出相位对整体性能的影响相当有限。与此同时，现代基于深度神经网络(DNN)的方法，如Conv-TasNet，隐式修改幅度和相位，在非常短的帧(2 ms)上产生了出色的性能。　　在这一观察的启发下，本文系统地研究了相位和幅度在不同帧长的DNN语音增强中的作用。结果表明，基于相位感知的神经网络可以...

2023-02-08 20:05:00 1118

原创论文翻译：2022_Time-Shift Modeling-Based Hear-Through System for In-Ear Headphones

论文地址：基于时移建模的入耳式耳机透听系统引用格式：摘要　　透传(hear-through，HT)技术是通过增强耳机佩戴者对环境声音的感知来主动补偿被动隔离的。耳机中的材料会减少声音 500Hz以上的高频成分。HT算法利用麦克风和用户耳朵之间的相对传递函数(RTF)产生人造声音，从而弥补环境声音的损失。通常，HT的性能取决于环境声音的到达方向(direction of arrival...

2023-02-07 08:54:00 832

原创论文翻译：2020：ECAPA-TDNN: Emphasized Channel Attention, Propagation and Aggregation in TDNN Based Speake...

论文地址：ECAPA-TDNN：在基于TDNN的说话人验证中强调通道注意、传播和聚集论文代码：https://github.com/TaoRuijie/ECAPA-TDNN引用格式：Desplanques B, Thienpondt J, Demuynck K. Ecapa-tdnn: Emphasized channel attention, propagation and aggreg...

2023-02-06 10:20:00 1867

原创论文翻译：2022_PercepNet+: A Phase and SNR Aware PercepNet for Real-Time Speech Enhancement

博客地址：凌逆战 (转载请注明出处)论文地址：PercepNet+: 用于实时语音增强的相位和信噪比感知 PercepNet引用格式：Ge X, Han J, Long Y, et al. PercepNet+: A Phase and SNR Aware PercepNet for Real-Time Speech Enhancement[J]. arXiv preprint arX...

2023-02-05 17:04:00 1237

原创论文翻译：2022_腾讯DNS 1th TEA-PSE: Tencent-ethereal-audio-lab personalized speech enhancement system for I...

论文地址：TEA-PSE: 用于ICASSP 2022 DNS挑战赛的Tencent-ethereal-audio-lab 个性化语音增强系统论文代码：引用格式：Ju Y, Rao W, Yan X, et al. TEA-PSE: Tencent-ethereal-audio-lab personalized speech enhancement system for ICASSP 20...

2023-02-03 16:06:00 1050

原创论文翻译：2022_2022_TEA-PSE 2.0：Sub-Band Network For Real-Time Personalized Speech Enhancement...

论文地址：TEA-PSE 2.0：用于实时个性化语音增强的子带网络论文代码：引用：摘要　　个性化语音增强(Personalized speech enhancement，PSE)利用额外的线索，如说话人embeddings来去除背景噪声和干扰语音，并从目标说话人提取语音。此前，Tencent - Ethereal - Audi...

2023-02-02 10:47:00 1226

原创动态范围控制原理

DRC介绍　　开门见山，动态范围的定义就是信号的最大幅值和最小幅值比值的对数(单位dB)，　　动态范围会受到系统中各个环节的影响。例如同样是这段音乐，在一个40dB背景噪声的环境中播放，那么由于掩蔽效应等因素的影响，最终实际听到的音乐动态范围实际上是50dB。　　动态范围会受到系统中各个环节的影响。例如同样是这段音乐，在一个40dB背景噪声的环境中播放，那么由于掩蔽效应等因素的影响，最终...

2023-01-11 18:45:00 2684

原创论文翻译：2022_DNS_1th：Multi-scale temporal frequency convolutional network with axial attention for spee...

论文地址：带轴向注意的多尺度时域频率卷积网络语音增强论文代码：https://github.com/echocatzh/MTFAA-Net引用：Zhang G, Yu L, Wang C, et al. Multi-scale temporal frequency convolutional network with axial attention for speech enhanceme...

2022-12-09 09:41:00 1980

原创论文翻译：2022_DeepFilterNet2: Towards Real-Time Speech Enhancement On Embedded Devices For Fullband Audi...

博客地址：凌逆战论文地址：DeepFilternet2: 面向嵌入式设备的全波段音频实时语音增强论文代码：https://github.com/Rikorose/DeepFilterNet引用格式：Schröter H, Rosenkranz T, Maier A. DeepFilterNet2: Towards Real-Time Speech Enhancement on Embed...

2022-11-16 11:59:00 2193

原创 Pytorch模型量化

在深度学习中，量化指的是使用更少的bit来存储原本以浮点数存储的tensor，以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点：更少的模型体积，接近4倍的减少；可以更快的计算，由于更少的内存访问和更快的int8计算，可以快2~4倍。一个量化后的模型，其部分或者全部的tensor操作会使用int类型来计算，而不是使用量化之前的float类型。当然，量化还需要底...

2022-10-25 20:41:00 10523 12

原创 Tensorflow Lite从入门到精通

　　TensorFlow Lite 是 TensorFlow 在移动和 IoT 等边缘设备端的解决方案，提供了 Java、Python 和 C++ API 库，可以运行在 Android、iOS 和 Raspberry Pi 等设备上。目前 TFLite 只提供了推理功能，在服务器端进行训练后，经过如下简单处理即可部署到边缘设备上。个人使用总结：如果我们只使用Tensorflow的高级AP...

2022-10-24 12:14:00 6198 1

原创论文翻译：2020_Residual Acoustic Echo Suppression Based On Efficient Multi-Task Convolutional Neural Netw

回声会降低语音通信系统的用户体验，因此需要完全抑制。提出了一种利用卷积神经网络实现实时残余声回波抑制的方法。在多任务学习的背景下，采用双语音检测器作为辅助任务来提高RAES的性能。该训练准则基于一种新的损失函数，我们称之为抑制损失，以平衡残余回波的抑制和nearend信号的失真。实验结果表明，该方法能有效抑制不同情况下的残余回波。

2022-10-10 09:47:30 1197

原创语音和噪声相关数据集(持续更新)

语音领域和纯净语音和纯净噪声数据集收集和整理

2022-10-07 18:15:45 10102 14

原创《古诗词里的快意人生》读后感

　　《古诗词里的快意人生》通过讲解诗人的一生让我了解每一首诗的来源背景。一生都在追求极致潇洒的天才诗人李白；一生遭遇很不幸，却心怀天下做狂歌的杜甫。为了功名来到边塞，从悔恨到渐渐爱上边塞的岑参。追求“不平则鸣”的韩愈；“世界以痛吻我，却报之以歌”的柳宗元；魅力四射的温庭筠，他写出了：玲珑骰子安红豆，入骨相思知不知，这句诗我可爱了。温庭筠的爱情却是比他小30多岁的鱼玄机，上天不会放过任何一个拆散...

2022-09-18 19:45:00 1470

原创《生死疲劳》读书有感

先上人物关系图读后感故事的开头是主人公西门闹因为地主身份被当做典型枪毙了，西门闹经过7次转世(驴，牛，猪，狗，猴，大头儿)亲眼见证了后世之事。转世为驴，见证了自己的妻妾们改嫁与生儿，身处合作社的时代，跟着蓝脸坚持单干，但随之而来的大饥馑，人民饥不裹腹，驴被饿昏的人民手撕充饥。转世为牛，除了蓝脸，举家被迫入社，你因为不服金龙的命令，被活活打死在公社的田地上。转世为猪，迎来了杏圆猪场...

2022-09-18 16:00:00 1184

原创神经网络模型的参数量和计算量

其实模型的参数量好算，但浮点运算数并不好确定，我们一般也就根据参数量直接估计计算量了。但是像卷积之类的运算，它的参数量比较小，但是运算量非常大，它是一种计算密集型的操作。反观全连接结构，它的参数量非常多，但运算量并没有显得那么大。FLOPs(Floating-point Operations)：浮点运算次数，理解为计算量，可以用来衡量算法的复杂度。一个乘法或一个加法都是一个FLOPsFLOP...

2022-09-08 14:02:00 4123 1

原创论文翻译：2021_A New Real-Time Noise Suppression Algorithm for Far-Field Speech Communication Based on ...

论文地址：一种新的基于循环神经网络的远场语音通信实时噪声抑制算法引用格式：Chen B, Zhou Y, Ma Y, et al. A New Real-Time Noise Suppression Algorithm for Far-Field Speech Communication Based on Recurrent Neural Network[C]//2021 IEEE Inter...

2022-08-26 17:38:00 1770

原创论文翻译：2020_Lightweight Online Noise Reduction on Embedded Devices using Hierarchical Recurrent Neural...

论文地址：基于分层递归神经网络的嵌入式设备轻量化在线降噪引用格式：Schröter H, Rosenkranz T, Zobel P, et al. Lightweight Online Noise Reduction on Embedded Devices using Hierarchical Recurrent Neural Networks[J]. arXiv preprint arXi...

2022-08-16 21:41:00 1816

原创论文翻译：2021_LACOPE: Latency-Constrained Pitch Estimation for Speech Enhancement

论文地址：延迟约束的语音增强基音估计引用格式：Schröter H, Rosenkranz T, Escalante-B A N, et al. LACOPE: Latency-Constrained Pitch Estimation for Speech Enhancement[C]//Interspeech. 2021: 656-660.摘要　　基频($f_0$)估计，又称基音跟踪，...

2022-08-07 21:37:00 1035

原创论文翻译：2022_Time-Frequency Attention for Monaural Speech Enhancement

论文地址：单耳语音增强的时频注意引用格式：Zhang Q, Song Q, Ni Z, et al. Time-Frequency Attention for Monaural Speech Enhancement[C]//ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Process...

2022-08-04 11:29:00 2072 2

原创 WAVE音频格式及及转换代码

音频信号的读写、播放及录音　　python已经支持WAV格式的书写，而实时的声音输入输出需要安装pyAudio(http://people.csail.mit.edu/hubert/pyaudio)。最后我们还将使用pyMedia(http://pymedia.org)进行Mp3的解码和播放。　　音频信号是模拟信号，我们需要将其保存为数字信号，才能对语音进行算法操作，WAV是Microsof...

2022-06-19 17:10:00 2990 2

转载论文翻译：2020_Residual Acoustic Echo Suppression Based On Efficient Multi-Task Convolutional Neural Netw

论文地址：基于高效多任务卷积神经网络的残余声回波抑制　　回声会降低语音通信系统的用户体验，因此需要完全抑制。提出了一种利用卷积神经网络实现实时残余声回波抑制的方法。在多任务学习的背景下，采用双语音检测器作为辅助任务来提高RAES的性能。该训练准则基于一种新的损失函数，我们称之为抑制损失，以平衡残余回波的抑制和nearend信号的失真。实验结果表明，该方法能有效抑制不同情况下的残余回波。关键词：residual acoustic echo suppression, convolutional neural n

2022-06-14 17:43:57 717

转载自适应滤波器算法综述以及代码实现

作者：凌逆战文章地址：自适应滤波器算法综述以及代码实现 - 凌逆战 - 博客园并不是每个自适应滤波器的的代码我都实现了，我需要一定的时间，一有时间我就会来更新代码，记得关注我，如果有问题记得反馈另外科研严谨，搞科研的建议多看论文，因为我是业余的，写这领域的博客主要是因为感兴趣爱好，博客也难免会有错误，所以不要以我为准，可以做个参考，如果能够帮到你，我会很欣慰。　　声学回声是指扬声器播出的声音在接受者听到的同时，也通过多种路径被麦克风拾取到。多路径反射的结果产生了不同延时的回声，包括直接回声和间接回声。直接回

2022-06-14 17:43:01 9086 1

转载 python：列表

list( ) # 创造列表list(可迭代对象)　　# 将可迭代对象创造成列表切片索引：列表[a:b]切片索引赋值：列表[切片] = 可迭代对象L = [2,3,4]L[0:1] = [23,34] #把L中的第一个换成[23,34]print(L) # [23, 34, 3, 4]L[2:] = [3.3,4.4,5.5] #[23, 34, 3.3, 4.4, 5.5]print(L)L[:] = [3, 4]L[0:0] = [1, 2] #[1, 2, 3, 4]在索

2022-06-14 16:27:30 530

转载 python：多进程

意义：充分利用计算机的资源提高程序的运行效率定义：通过应用程序利用计算机多个核心，达到同时执行多个任务的目的实施方案：多进程、多线程并行：多个计算机核心并行的同时处理多个任务并发：内核在多个任务间不断切换，达到好像内核在同时处理多个任务的运行效果程序：是一个可执行文件，是静态的，占有磁盘，不占有计算机运行资源进程：程序在计算机中运行一次的过程、进程是一个动态的过程描述，占有CPU内存等计算机资源的，有一定的生命周期* 同一个程序的不同执行过程是不同的进程，因为分配的计算机资源等均不同父子进程：系统中每一个

2022-06-14 16:26:56 1404

转载 python：多线程

线程是一种多任务编程的方式，可以使用计算机多核资源。线程又被称为轻量级的进程线程特征threading线程模块创建线程对象参数t.start()：启动线程t.join(timeout)：回收线程线程的其他属性t.is_alive()：查看线程状态t.name：线程名称　　默认Thread-1t.setName()：设置线程名称threading.currentThread()：获取当前线程对象from threading import Thread, currentThreadfr

2022-06-14 16:26:08 978

转载通过电脑快捷键高效利用时间

博客作者：凌逆战博客地址：https:////www.cnblogs.com/LXP-Never/p/11448661.html　　相信各位和我一样也有同样的困恼，就是编写代码的时候，总是写一会要动一下鼠标，这样一来，其实大部分时间都用来把手移到鼠标的过程中。因此我写下这篇博客，来给大家总结一些作为程序员必须知道的快捷键。加快大家的工作效率。　　本文会总结的比较全，以前很重要的我会通过加粗色彩等方式，进行强调，节省大家的学习成本。所谓熟能生巧，用着用着不就会了吗。Ctrl+Shift+Esc：打开任务管理器

2022-06-14 16:21:08 469

原创将博客搬至CSDN

我自愿将博客园的文章搬移至CSDN

2022-06-06 11:09:00 375

原创声学感知刻度(mel scale、Bark scale、ERB)与声学特征提取(MFCC、BFCC、GFCC)

本文地址：https://www.cnblogs.com/LXP-Never/p/16011229.html (引用请注明出处)本文代码：https://github.com/LXP-Never/perception_scale作者：凌逆战 | Never.Ling梅尔刻度　　梅尔刻度(Mel scale)是一种由听众判断不同频率音高(pitch)彼此相等的感知刻度，表示人耳对等距......

2022-05-28 19:42:00 5503 4

原创语音领域视频课程及书籍(不定期更新)

国内【深蓝学院】语音信号处理——宋辉，李先刚【深蓝学院】语音识别综述【深蓝学院】语音识别：从入门到精通——谢磊、孙思宁、张彬彬、吕航、许开拓【深蓝学院】语音合成算法：从HTS到端到端【深蓝学院】语音合成：基础与前沿——谢磊、陈云琳、阳珊、张雨超【深蓝学院】语音算法：前沿与应用——李先刚、陈果果、邹伟【李宏毅】用于人类语言处理的深度学习 2020 春季【bilibili】CCF语音...

2022-05-10 17:38:00 885

RNNoise的python版本

源RNNoise是C语言写的，阅读门槛较高，我对照着每行C语言改写成了Python，python阅读起来更加轻松，方便大家对RNNoise的更深一步了解，以及调试代码。

2022-07-11

IEMOCAP数据库（百度云盘）.txt

互动式情感和弦运动捕捉（IEMOCAP）数据库是一个实用的多模式多说话者数据库，最近在南加州大学SAIL实验室收集。它包含大约12个小时的视听数据，包括视频，语音，面部动作捕捉，文本转录。它由两部分组成，参与者在其中进行即兴表演或剧本剧本，特别是为了引起情感表达而选择的。IEMOCAP数据库由多个注释者注释为类别标签，例如愤怒，幸福，悲伤，中立，以及维数标签（如价，激活和支配）。详细的动作捕捉信息，引发真实情绪的交互式设置以及数据库的大小，使该语料库成为社区中现有数据库的有价值的补充，用于研究和建模多模式和表达性人类交流。

2021-07-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

RNNoise的python版本

IEMOCAP数据库（百度云盘）.txt

论文投稿PACS索引(Physics and Astronomy Classification Scheme)

python+飞机大战项目

python电子词典项目代码+笔记

空空如也