lujian1989-CSDN博客

原创 Linux shell多进程并发及管道阻塞处理

在linux平台上，shell脚本进行多进程并发处理是常见的操作，尤其是在需要并行处理大量数据的时候。然而在编码执行过程中遇到了一些问题，记录于下。1. 并发控制网上搜索能找到一些并发控制方法，如一、linux shell多进程以及二、Linux Shell多进程并发以及并发数控制。两篇文章的方法思路一致，仅在实现细节上有差异。其中，文章一的方法在加锁处理进程安全方面更好，文章二在背景知识.

2020-12-10 10:20:49 1843 2

在语音处理中，音频文件读写是基本操作。然而读写方式乃至归一化处理的多样化，有可能导致后续处理的偏差乃至错误。本文汇集实践中所遇的一些方法，并参考了其他文章，确保读写操作的准确性和一致性。前置条件本文以实践中常见的音频文件参数（wav格式，PCM编码，单通道，采样率16KHz，位深16bit）为例，如果参数不同需做对应调整。一. 文件读取1. librosa import librosa wav_path='' sample_r.

2020-12-02 15:12:00 19381 9

原创 ICASSP2020中语音合成部分论文阅读（未完待续）

ICASSP2020在5月份已经结束，拿到论文集后，慢慢花时间看一看同行的成果和进展，也算是汲取一点新鲜养分吧。简短介绍的同时也会附上自己粗浅鄙陋的想法。谬误良多，不吝指教。文章目录一. 综述二. 声学模型-稳定性1. 《Focusing on Attention： Prosody Transfer and Adaptative Optimization Strategy for Multi-Speaker End-to-End Speech Synthesis》一. 综述 &nbs.

2020-06-18 16:45:20 1843 1

原创 Tensorflow迁移学习加载预训练模型并修改变量shape和value的方法

迁移学习在深度学习中是经常被使用的方法，指的是在一个任务中预训练的模型被用于另一个任务的模型训练，以加快模型训练，减少资源消耗。然而网络搜索相关的话题，基本上只涉及加载预训练模型的特定变量值的方法，即不涉及预训练模型某个变量与当前任务网络对应变量shape改变的处理。在具体的语音合成多说话人模型迁移学习得到单说话人模型的任务中，就涉及到了迁移变量改变shape的情况，将解决方法如下列出。...

2020-02-16 21:02:56 3516 4

转载 Linux xargs命令的理解和使用

xargs是Linux中一个很常用的命令，然而之前即使用到也没能够很好地理解。这次在解决“bash: /bin/mv: Argument list too long”问题时，找到了一份很容易理解的资料。转载地址：xargs命令详解，xargs与管道的区别文章目录一. 为什么要用xargs，问题的来源二. xargs是什么，与管道有什么不同三. xargs的一些有用的选项1. -d 选项2...

2019-06-14 16:54:23 3239 1

原创集群个人用户离线复制管理Python环境的一些问题

项目的Python环境一直没有有效管理，大家都是用的同一个环境。某个包需要特定的版本，必然需要考虑升级会不会影响其他人、其他程序的运行。在研究WaveGlow代码时，其依赖的torch1.0高于当前的0.4版本，故研究了一下Python环境的复制和管理问题。中间遇到了一些问题，一一解决并决心记录下来。前置条件：个人非root用户、集群共享存储、离线环境（增加了问题解决的难度）、使用了Anac...

2018-12-26 14:45:14 728

原创 tensorflow变量管理与命名空间

在训练深度网络时，为了减少需要训练参数的个数、或是多机多卡并行化训练大数据大模型等情况时，往往需要共享变量。另外一方面是当模型变得非常复杂的时候，往往存在大量的变量和操作，如何避免这些变量名和操作名的唯一不重复，同时维护一个条理清晰的graph非常重要。本文主要涉及tensorflow中变量管理和命名空间相关的函数：tf.Variable，tf.get_variable，tf.variable...

2018-11-15 19:31:54 1568 1

翻译【论文翻译】Deep Voice 3：通过卷积序列学习来扩展语音合成

Deep Voice 3 引入了全卷积序列到序列式模型来进行语音合成，这种新架构在语音训练速度上有了数量级的提升，经过800 多个小时的语音数据学习，它可以合成 2400 多钟不同的语音结果。Deep Voice 3的意义在于探索语音合成模型训练的数据容量上限。原论文链接： Deep Voice 3: Scaling Text-to-Speech with Convolution...

2018-09-19 10:19:44 3661 2

转载【论文翻译】WaveNet：一种原始音频的生成模型

Google Brain团队结合Tacotron和WaveNet等研究思路，增加了更多改进，最终实现了新的端到端语音合成系统Tacotron 2，达到了接近人声的效果。原论文链接： WaveNet: A Generative Model for Raw Audio 最近开始研究端到端语音合成。相关的论文原本准备自己翻译，看到网上已经有翻译的比较好的版本，故转载于...

2018-08-30 18:52:56 7135 1

翻译【论文翻译】使用少量样本的神经语音克隆

这篇论文探讨了解决语音克隆问题的两种基本方法：说话人自适应（speaker adaptation）和说话人编码（speaker encoding）。适用于带有说话人嵌入的多说话人语音生成模型，不会降低音频质量。原论文链接： Neural Voice Cloning with a Few Samples摘要　　语音克隆是个性化语音接口的一项备受期待的能力。基于神经网络的语...

2018-08-28 11:15:02 3177

转载【论文翻译】联合学习对齐和翻译的神经机器翻译

这篇论文在采用RNN编码器-解码器结构做端到端的神经机器翻译的基础上，使得模型可以在预测下一个词的时候，自动地搜索源句子相关的部分，这就是attention机制。原论文链接： Neural Machine Translation by Jointly Learning to Align and Translate 最近开始研究端到端语音合成，由于Attention机制在...

2018-08-09 13:48:45 2360

转载【论文翻译】通过梅尔频谱预测来训练WaveNet的自然语音合成

Google Brain团队结合Tacotron和WaveNet等研究思路，增加了更多改进，最终实现了新的端到端语音合成系统Tacotron 2，达到了接近人声的效果。原论文链接： Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions 最近开始研究端到端语音合成。相关的论...

2018-08-06 18:15:41 3653

转载【论文翻译】Tacotron：端到端语音合成

Tacotron是谷歌于2017年提出的端到端语音合成系统，该模型可接收字符的输入，输出相应的原始频谱图，然后将其提供给 Griffin-Lim 重建算法直接生成语音。原论文链接： Tacotron: Towards End-to-End Speech Synthesis 最近开始研究端到端语音合成。相关的论文原本准备自己翻译，看到网上已经有翻译的比较好的版本，...

2018-08-04 16:16:17 5001

翻译 CUED-RNNLM：一个有效训练评估RNN语言模型的开源工具包

本文介绍了CUED-RNNLM，一个开源工具包，它能支持高效的基于GPU的RNNLMs训练。

2017-12-27 21:03:27 4675 3

原创 Linux iptables防火墙规则配置的两个坑

Linux iptables防火墙规则配置的两个坑，包括规则保存和规则生效机制

2017-09-06 17:00:59 8789 3

翻译 Merlin doc 0.0.1

Merlin doc 0.0.1

2017-02-20 10:39:11 2095

翻译 Merlin：一个开源的神经网络语音合成系统

介绍Merlin语音合成工具包用于基于神经网络的语音合成。该系统将语言特征作为输入，采用神经网络来预测声学特征，然后将声学特征传递到声音合成机（vocoder）以产生语音波形。

2017-02-20 10:30:16 24328 5

转载语音信号处理之（四）梅尔频率倒谱系数（MFCC）

MFCCs（Mel Frequency Cepstral Coefficents）是一种在自动语音和说话人识别中广泛使用的特征

2017-01-04 10:55:24 1168

原创数据准备（快速构建ASR系统）

在自己拿到语音数据后，快速构建一个简单的ASR语音识别系统

2017-01-03 17:48:22 3454

原创语音识别之发音字典

发音字典(lexicon)包含了从单词(words)到音素(phones)之间的映射，作用是用来连接声学模型和语言模型的。

2016-12-29 18:57:34 21233 4

原创构建语言模型（二）：模型训练与评估

Ngram语言模型的训练与评估

2016-12-13 11:31:27 8556

原创构建语言模型（一）：文本语料处理

1. 语言模型概述与流程2. 文本语料抓取与处理

2016-12-13 10:55:51 6783 2

原创 mysql远程访问，主从/主主双机备份，以及使用keeplived实现故障自动切换（二）

双机故障切换

2016-11-22 10:57:58 544

原创 mysql远程访问，主从/主主双机备份，以及使用keeplived实现故障自动切换（一）

1. mysql远程访问2. 主从/主主双机备份3. keepalived故障自动切换

2016-11-22 10:56:46 580

原创使用Scrapy递归爬取网页

1. scrapy介绍与安装　　Scrapy，Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。（百度百科的描述）　　　　安装过程见CentOS7下安装Scrapy，基于Python2.7.5版本。2. 项目代码与分析（1）创建项目scrapy startproject Fi

2016-11-05 17:23:47 11067

原创千里之行，始于足下

千里之行，始于足下

2016-10-31 20:01:51 377

《Java2程序设计实用教程(第2版)》课件

本课程通过全面、系统地介绍Java语言的基础知识、运行机制、多种编程方法和技术，使学生理解和掌握面向对象的程序设计方法，理解和掌握网络程序的特点和设计方法，建立起牢固扎实的理论基础，具备综合应用程序的设计能力。

2011-04-21

单片机入门与巩固提高（全面）

第一部份：入门一、单片机的基础知识二、任务一（单灯闪烁）三、任务二（键控灯亮）四、任务三（彩灯）第二部份：巩固提高一、指令的全面认识二、任务四（定时器）三、任务五（中断）四、任务六（串口应用）第三部份：提高一、任务七（外部ROM、RAM扩展）二、任务八（并行口扩展）三、综合应用（一）四、综合应用（二）

2011-04-21

MATLAB语言环境下基于小波变换的图像处理

本文简要介绍了基于小波变换的图像分解与重构，讨论了matlab环境下图像压缩和图像融合的基本方法

2011-04-21

线性直流稳压电源的设计

通过集成直流稳压电源的设计、安装和调试，要求学会： (1)选择变压器、整流二极管、滤波电容及集成稳压器来设计直流稳压电源； (2)掌握直流稳压电路的调试及主要技术指标的测试方法。

2011-04-21

基于P2P技术的网络视频会议系统研究

P2P 技术的迅速发展使其成为构建广域网中大型分布式系统的有力工具。P2P 流媒体系统作为P2P 技术的重要应用之一也成为当前分布式系统领域的一个研究热点。介绍利用P2P 流媒体技术设计视频会议系统的方法，重点讨论了路由选择机制、流媒体播放方法和节点管理机制。

2011-04-21

基于GSM短信模块家庭防盗报警系统

本系统主要由单片机和GSM短信模块组成，借助最可靠、最成熟的GSM移动网络，以最直观的中文短消息或电话形式，直接把报警地点的情况反映到您的手机屏幕上。它采用主动式红外传感器进行检测，变有形的传统防盗网防盗窗为无形，给火灾时的逃生提供方便。并配备烟雾传感器和燃气泄漏传感器，实现防火、防燃气泄漏的作用。

2011-04-21

基于Matlab的遗传算法实现

运用Matlab编程实现遗传算法，数值仿真验证了该实现方法的有效性。

2011-04-21

改进的遗传算法求解TSP问题

(用caj view打开）本文由三个部分组成，第一部分是对研究背景的介绍，给出了最优化问题的描述，概括了求解最优化问题的数学方法和演化计算方法。第二部分是对遗传算法的研究:对传统的遗传算法进行了简要的分析，介绍了一些改进的遗传算法，在此基础上，提出了一种基于相似性的遗传算法。第三部分是遗传算法的应用实践:将所设计的算法应用到代表性的旅行商问题和车间调度问题

2011-04-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

lujian1989的专栏

原创 Linux shell多进程并发及管道阻塞处理

原创 python读写音频文件小结

原创 ICASSP2020中语音合成部分论文阅读（未完待续）

原创 Tensorflow迁移学习加载预训练模型并修改变量shape和value的方法

转载 Linux xargs命令的理解和使用

原创集群个人用户离线复制管理Python环境的一些问题

原创 tensorflow变量管理与命名空间

翻译【论文翻译】Deep Voice 3：通过卷积序列学习来扩展语音合成

转载【论文翻译】WaveNet：一种原始音频的生成模型

翻译【论文翻译】使用少量样本的神经语音克隆

转载【论文翻译】联合学习对齐和翻译的神经机器翻译

转载【论文翻译】通过梅尔频谱预测来训练WaveNet的自然语音合成

转载【论文翻译】Tacotron：端到端语音合成

翻译 CUED-RNNLM：一个有效训练评估RNN语言模型的开源工具包

原创 Linux iptables防火墙规则配置的两个坑

翻译 Merlin doc 0.0.1

翻译 Merlin：一个开源的神经网络语音合成系统

转载语音信号处理之（四）梅尔频率倒谱系数（MFCC）

原创数据准备（快速构建ASR系统）

原创语音识别之发音字典

原创构建语言模型（二）：模型训练与评估

原创构建语言模型（一）：文本语料处理

原创 mysql远程访问，主从/主主双机备份，以及使用keeplived实现故障自动切换（二）

原创 mysql远程访问，主从/主主双机备份，以及使用keeplived实现故障自动切换（一）

原创使用Scrapy递归爬取网页

原创千里之行，始于足下

《Java2程序设计实用教程(第2版)》课件

单片机入门与巩固提高（全面）

MATLAB语言环境下基于小波变换的图像处理

线性直流稳压电源的设计

基于P2P技术的网络视频会议系统研究

基于GSM短信模块家庭防盗报警系统

基于Matlab的遗传算法实现

改进的遗传算法求解TSP问题

空空如也