自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shaopengfei的专栏

https://github.com/feelins,微信公众号:极地语音工作室

  • 博客(94)
  • 资源 (1)
  • 收藏
  • 关注

原创 Praat脚本-000 | 实用的Praat脚本总索引

Praat_Scripts Praat脚本该项目包括一些Praat常用脚本,并结合简单实例说明如何使用这些脚本,每一个独立的目录里面有示例文件以及结果文件,适用于已经对Praat基本操作有些了解,对时长,基频,共振峰等基本声学参数有所了解的初学者。该项目包括以下内容:Praat基本操作;Praat对文件,包括标注文件TextGrid、音频文件wav的操作;Praat对具体的标注信息的操作,比如tier, interval替换、增加、删除等操作;使用Praat提取主要的声学参数,时长,基频,共

2020-09-09 14:38:08 6790

原创 结合Praat进行语音实验的步骤

[更新日期:2018年02月10日,欢迎提出修改建议,不断更新。咨询邮件[email protected],请务必附件样例以及有问题脚本,出错提示等,否则不予回复]近期更新了几篇Praat脚本从标注的TextGrid里提取数据一些脚本,发现有一些朋友会问到更细节的问题,于是有一个想法把结合Praat进行一个语音学上常用的实验研究的步骤都整理出来,希望对需要的朋友有所帮助。其实从事语音...

2016-05-10 15:39:52 57350 25

原创 语音标注自动音段对齐工具SPPAS使用笔记

[更新日期:2019年08月08日 。咨询邮件[email protected],请务必附件样例以及有问题脚本,出错提示等,否则不予回复] SPPAS工具是由Brigitte Bigi(Laboratoire Parole et Langage - Aix-en-Provence - France)开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具...

2014-01-16 10:42:00 27354 48

原创 Praat脚本-038 | 批量替换标注TextGrid里的换行符

的操作,所谓正则表达式是通过一些约定的符号规则,来统一表示某一类的符号,或者是一些特殊的符号,比如我们今天要解决的换行符的问题。这里面包括了常用的很多的功能,比如所有字母类,所有数字类,一些简单的通配符,大小写,制表符等,有兴趣的可以自己去查看,如果确实有其它功能需要支持的,也可以公众号后台留言。我们在做标注的时候,可能会犯这样一个小错误,就是在标注的内容中间不小心进行了换行,大概会成为这个样子。,这里的A1指要替换的左边的第一个单元格,我们在这个格子的左下角的黑十字拖动它,将会批量生成所有的结果。

2023-11-25 15:37:55 903

原创 Praat脚本-037 | 批量把标注TextGrid生成韵律文本

这里我们想提示一下有这几个信息需要关注,第一是因为这里采用的是标贝公司的开源标注数据,这些数据的汉字层是有停顿边界的,即那些1,2,3,4等;这个标注的使用者也主要是有经验的语言学专家,或者一些研究者等,在实际的工程利用中,工程师通常要处理的是直接的文本或者转化成某种格式的文件,因为。总之,脚本想再全面也不可能覆盖所有的情况,如果确实有类似的需求,而你的标注是比较复杂的,可以加入QQ咨询群,或者在公众号后台发信息。我们先考虑中文标注的情况,假设我们有两层最基本的标注,一层是读音音素信息,一层是汉字层。

2023-04-22 11:27:07 1817

原创 Praat脚本-040 | 将文本按行分别保存为独立的文件

在讲脚本操作之前,我们先说一下这个输入的文本,如果你有类似的需求,而恰好有这样规整格式的文本,那当然是再好不过的了。但是如果你是需要自己制作这个文本,这里有一个问题就是要务必保证在每个文件名后面是以TAB键隔开的,可能你会反问,为什么不可能用逗号,分号,。我们在工作中或许会有这样的需求,我们有一个文本文件,它是按行保存了很多内容,我们现在希望将这些文本按行分别保存为独立的文件。那么在保存的时候,脚本会按行为顺序指定一个5位的数字,同样如果你可以修改脚本,可以在脚本里找到这个5的位置,修改数字的位数。

2023-04-21 20:17:16 394 1

原创 flask-admin学习笔记

近期在工作中需要维护若干个信息表,在这个过程中需要经常对表格进行操作、交叉操作、各个表格同步,和某平台信息同步。。。在此过程中需要建立一个“隐性”的流程,要第一步同步A和B,再同步B和C,。。。而检索更是痛苦,更夸张的是,有时候需要根据不同的需求,将表格的某一些部分拷贝出来。。。这可能是一个数据库(甚至是数据系统)的操作,不可否认可以通过其它N个方案实现,但是为了满足笔者这种web前后端菜鸟学习的欲望,还是发现了这个小小的项目,在里面找到一个相对比较简单和功能丰富的示例完成这个需求。需求:该项目来自http

2022-12-05 21:40:55 1163

原创 Praat脚本-033 | Praat脚本裁剪归整句中停顿

在应用中,发现也会用到这样一个处理,就是希望能批量的对于句子中间可能存在的比较长的静音段进行处理,因为在录音的过程中,虽然希望在句中的静音段都比较适中,但是因为毕竟在录音的过程中很难控制的各种状态和因素,再者,如果手头上的语料是来自遥远的“年代”,或者来自网上的录播等途径,那就更有必要进行这样的操作

2022-12-03 23:26:42 987 1

原创 Praat脚本-036 | Praat脚本批量为音频添加首尾静音段

有一个小的应用是有一批音频信号,想批量的通过脚本为这些音频信号在首、尾都增加一小段静音段。这里就通过Praat生成一小段静音段的音频信号,再分别拼接到原来音频信号的首、尾,从而保存为新的音频信号。......

2022-06-11 14:12:07 850 2

原创 Praat脚本-027 | 通过基频曲线的距离做一个声调判别器

这里写目录标题使用背景如何做使用说明获取脚本关注公众号咨询QQ群关注版权说明使用背景我们已经知道如何利用Praat脚本提取基频,如果对使用Praat提取的基频是不是可用有疑问的可查看这篇文章(), 而如果不知道如何提取基频的可查看这篇文章()。今天我们来定义一个小小的应用,我们引进一个曲线距离的概念,来比较一下基频值,而基频值是直接反映声调或者语调的参考,那么我们研究一下是否通过曲线距离这个概念,能够对声调有所区分,可以定义为一个简单的声调分类器。作为尝试,我们使用的是中文普通话的数据,但是这样的参考

2022-04-10 12:55:49 3727

原创 更优雅熟练的使用git-学习记录

目录Git 与 SVN 区别git克隆仓库参考Git 与 SVN 区别Git 不仅仅是个版本控制系统,它也是个内容管理系统(CMS),工作管理系统等。如果你是一个具有使用 SVN 背景的人,你需要做一定的思想转换,来适应 Git 提供的一些概念和特征。Git 与 SVN 区别点:1、Git 是分布式的,SVN 不是:这是 Git 和其它非分布式的版本控制系统,例如 SVN,CVS 等,最核心的区别。2、Git 把内容按元数据方式存储,而 SVN 是按文件:所有的资源控制系统都是把文件的元信息隐藏

2022-04-04 16:44:41 424

原创 Praat提取的基频可以工程应用吗?

`Praat`作为普通语音学习者的标注工具已经算是比较经典的工具了。近些年来,随着AI的兴起,神经网络的算法更新迭代也很迅速,这其中有一些算法会涉及到基频,也称为音高,这个参数的应用。而作为学习者在学习科研中,基频也是一个衡量声调或者语调的重要表现特征。今天的话题是想比较使用`Praat`提取的基频和两种工程应用级别提取的基频是否有比较大的差异,换句话说,如果使用`Praat`这个工具提取的基频,能做到工程应用吗?

2022-03-20 21:21:45 4183 1

原创 Python脚本处理标注文件和音频匹配个数问题

目录引题数据说明代码说明获取脚本关注版权说明引题在语音标注过程中,涉及大量的语音标注,尤其是有多人分工进行时,难免会出现很多不匹配的文件,标注类的文件(通常为*.TextGrid),和音频类(通常为*.wav),当两者出现个数不匹配的时候,无论是后期使用脚本提取参数,和运行某些工程类的模型,都会引起报错。本文针对Python初学者,提供一个简单的脚本,检查两类文件(不限于上述两类,脚本可用于其它的扩展名的两类文件)的不匹配状况。主要目的还是学习一下基本的检查目录里的文件的操作,适用于Python学习者

2022-03-17 18:12:32 5007

原创 Praat脚本-033 | Praat脚本批量提取MFCC参数

MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的, 它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如:对于一帧有512维(采样点)数据,经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了降维的目的。【原文链接:https://blog.csdn.net/fengzhonghen/article/det

2022-03-13 17:11:07 4808

原创 Praat脚本-032 | Praat脚本批量转化TextGrid格式为json格式

JSON 是存储和交换文本信息的语法,类似 XML。JSON 是轻量级的文本数据交换格式。JSON 使用 Javascript语法来描述数据对象,但是 JSON 仍然独立于语言和平台。JSON 解析器和 JSON 库支持许多不同的编程语言。 目前非常多的动态(PHP,JSP,.NET)编程语言都支持JSON。JSON 具有自我描述性,更易理解。如下:{ "sites": [ { "name":"菜鸟教程" , "url":"www.runoob.com" }, { "name":

2022-03-13 16:33:00 1072 3

原创 Python实现文件/文件夹名按字符串排序或者按数字排序

如下图,获取sample_data路径下的文件夹名,其实这是我们希望得到的排序方式。实际上,当我们直接使用sort排序时,得到的是:import osinput_dir = r'./sample_data'file_list = os.listdir(input_dir)print(file_list)file_list.sort() # 文件名 按字符串排序print(file_list)得到的输出是:[‘file101.txt’, ‘file2.txt’, ‘file23.tx

2022-03-13 10:36:20 11119

原创 VS Code中使用Python相对路径问题

在VS Code环境运行Python脚本有一个困扰,举个例子:我的工作目录是/Python_Work,我在工作目录中创建了文件/Python_Work/Part-02/test.py, 并且运行test.py生成了file.txt文件:with open('file.txt', 'w') as f: f.write('HelloWorld')我们以为file.txt在/Python_Work/Part-02/路径下,和创建它的test.py在一个路径中。结果file.txt这个文件却在/Pyt

2022-03-13 10:05:17 1477

原创 Python处理有关语言学语音学脚本的项目【GitHub: Python-linguistic】

GitHub: Python-linguistics - 持续更新中项目地址:https://github.com/feelins/Python-linguistics这个项目主要和语言学专业的数据处理,包括但不限于语音、文本等方面,使用Python的一些脚本和技巧,同时也面向初学者,提供短小精悍的一些练手学习的脚本。欢迎关注公众号:极地语音工作室;CSDN博客:https://blog.csdn.net/shaopengfei说明:每一部分为一个主题,第一、第二部分适合初学者练手;第三部分为

2022-03-12 12:46:35 1354

原创 Ubuntu 20.04.3 Anaconda安装及Python多版本虚拟环境配置

目前最新的一些学习项目,都是基于Python 3 以上, 为了兼容有些稍老的项目,还是要使用Python2.7环境,查了一下,可以通过安装 Anaconda3,再实现切换Python自由。目录安装Anaconda配置虚拟环境基于 python3.6 创建一个名为py3_shaopf 的环境激活 py2 环境切换到python3安装Anaconda官方下载地址:https://www.anaconda.com/download/可以通过内置的Firefox浏览器对其进行下载,注意下载对应的Linux版

2022-03-12 11:35:33 4769 1

原创 Praat脚本-031 | 批量转化mp3格式为wav格式

通常推荐大家在做语音实验、或者语音处理的时候使用的首选音频格式为wav格式,但是可能由于每个人接触的项目,课题的原因,也会使用到大量mp3格式的音频。表面上看这两种格式没有比较明显的区别,mp3格式是一种较大程度保留了wav信息的一种压缩格式。如以下同一个文件,转化为mp3格式前后的大小为:LengthName65113000001.mp3255404000001.wav可见两种格式大小还是相差很大的。日常也有很方便的工具,如格式工厂能够转化任意格式的文件。这里只是提

2022-01-15 17:29:47 2859

原创 Praat脚本-030 | 谈谈自动标注这点儿事(4)

,比如完全零基础的强制的平均增加边界的(Praat脚本-023 | 谈谈自动标注这点儿事(1)), 基于Praat脚本的Easy-align(),便于操作的工具类似(语音标注自动音段对齐工具SPPAS使用笔记), 本期小结一下,以及介绍一种目前比较专业的自动标注框架。前面零零散散为大家介绍或者推荐了几种跟自动标注相关的内容,第一篇为大家推荐了第一种级别的“自动标注”,其实相当于协助大家把一些需要的信息增加进去。Praat脚本-023 | 谈谈自动标注这点儿事(1)第一,傻乎乎的自动标注,第二,使用

2021-11-27 22:30:40 2113 1

原创 Praat脚本-029 | 一种更有效的校对音频内容的方案

目录引题安装环境安装Python安装WxPython安装JuliusSPPAS使用数据格式数据准备准备音频和文本导入SPPAS进行切分关注版权说明引题在语音标注工作中,精标工作是大多数情况下必需的。在大数据,人工智能的大环境下,有一种工作也是数据整理的重要组成部分,这就是文本校对工作,或者叫字音一致性校对。比如,我们现在有数十小时,甚至上百小时的数据,这些数据是参差不齐的,在通过基础的语音识别模块之后,我们得到了一些文本结果,显然如果通过更好的得到一句话准确的文本内容,这将会为后续的工作产生更积极的效果

2021-09-24 09:51:37 1393

原创 Praat脚本-030 | 谈谈自动标注这点儿事(3)

目录简介安装环境安装Python安装WxPython安装JuliusSPPAS使用数据格式数据准备准备音频和文本导入SPPAS进行切分关注版权说明简介SPPAS工具是由Brigitte Bigi(Laboratoire Parole et Langage - Aix-en-Provence - France)开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具,目前应用于法语、英语、汉语等都有不错的效果。虽然音段自动对齐的准确率并不完善,但是对于一般的语音研究者来说,能够自动

2021-09-05 12:19:50 1276

原创 推荐 | 实用的开源数据(更新中)

巧妇难为无米之炊,今天的推荐是两套开源数据。关注本公众号的朋友,可能一部分是已经在做自己的课题或者项目,可以直接使用本站这些脚本或者程序的;也有的刚在学习进行中,那么手头可能未必会有合适的数据来进行实验或者提取,分析。这篇文章的目的,为大家推荐两套开源数据库,这些数据有wav和标注好的结果,可以直接用来提取参数,了解实验过程。开源数量是公开免费使用的,但是不能用做商业用途,拿来用做学术研究,写论文都是没问题的,原则上要注明出处。...

2021-08-08 15:24:45 614

原创 Praat脚本-026 | 谈谈自动标注这点儿事(2)

目录引题操作解释运行脚本获取脚本关注QQ群引题使用Praat进行语音标注,这是Praat使用者最基础的功能。在较原始的语音生产阶段,我们开始用Praat标音,打开一个句子,一个时间点一个时间点的加蓝条条,还要调整,还要听,好不容易标完了一层,没想到你的方案决策者或许还会让你标几层,十多层。。。!?希望看到此处的你没有在眼科挂号。毕业之后,你可能去了一家大厂,你发现这里标注的是上万句,这是什么鬼,毕业的目的应该不是来这里标蓝条条吧?!很显然,在所谓的大数据时代,这些大厂用的是自动标注。根据不同的使用情

2021-08-07 15:33:03 1323 5

原创 Praat脚本-028 | 批量合并目录内的音频文件

这里写目录标题使用背景实现效果使用说明获取脚本关注公众号咨询QQ群使用背景本脚本适用于如何快速合并某一批目录里的所有音频(.wav)。假定现在有这样一个场景,你得到一大批TextGrids,这些大概有1000条,这1000条是不同的人完成的,你的同学A负责标注完成了第1,2层,你的同学B负责标注完成了第3,4层,甚至前者是第1,3层,后者是第4,7层,如此种种。现在你的任务是要把这两位同学的任务合并在一块,形成一个新的TextGrid文件,这就用到了Praat的合并操作,Merge,但是实现起来主要是要

2021-08-06 09:23:43 954

原创 Praat脚本-025 | 轻松合并不同目录里的TextGrids

这里写目录标题使用背景实现效果使用说明获取脚本关注公众号咨询QQ群使用背景假定现在有这样一个场景,你得到一大批TextGrids,这些大概有1000条,这1000条是不同的人完成的,你的同学A负责标注完成了第1,2层,你的同学B负责标注完成了第3,4层,甚至前者是第1,3层,后者是第4,7层,如此种种。现在你的任务是要把这两位同学的任务合并在一块,形成一个新的TextGrid文件,这就用到了Praat的合并操作,Merge,但是实现起来主要是要考虑到我刚才说的可能情况各种各样,如何使用更方便,而且能够任

2021-05-22 15:28:36 763

原创 Praat脚本-024 | 如何使用PyToBI工具自动标注韵律边界调

ToBI介绍ToBI是标注语调模式和其它一些韵律层面的信息的系统,最初提出用于英语句子上,目前在其它很多语言都有使用。详细说明可参考它的官方网站,以及有大量的文献。小编只是偶然遇到github上这个项目,分享给大家。项目来源今天推荐大家一款自动标注ToBI语调模式及一些韵律特征的开源工具包,PyToBI,笔者在试用的时候,发现有些地方操作有问题,发信请作者放一下数据,作者说因为版权的原因,她只回复了一个TextGrid,也没有放wav,我的目录里放了3句话,包括wav和TextGrid,在praat

2021-05-20 22:02:08 2440 10

原创 Praat脚本-023 | 谈谈自动标注这点儿事(1)

目录引题操作解释运行脚本获取脚本关注QQ群引题我们开始用praat标音的时候,打开一个句子,一个地方一个地方的加一个蓝条条,还要调整边界,还要听听对不对,好不容易标完了一层,你的老板竟然还要弄好几层的蓝条条!?等标完几十句话,有的人疯了,没疯的也去医院挂眼科了!!当你毕业之后,你去了一家大厂,你发现人家标注的是上万句,这,什么鬼,我毕业的目的应该不是来这里标蓝条条吧?!这些大厂用的是自动标注,这个技术有四个层次,第一,傻乎乎的自动标注,第二,使用脚本的自动标注,第三,使用诸如SPPAS的自动标注

2021-04-27 22:27:49 3806 5

原创 Praat脚本-022 | 提取时长和音强

目录引题操作解释运行脚本获取脚本关注QQ群引题提取基频Praat脚本-009 | 提取时长和基频,提取共振峰Praat脚本-010 | 提取时长和共振峰,提取音强,这大概是最常用的三类特征。经热心读者提醒,貌似前期并没有上传过提取音强的脚本。声音的强度是一个客观的物理量,其常用单位为“分贝(db)”,在Praat里用Intensity表示。操作解释我们举一个例子说明Praat对基频的一些操作,如图所示。这是一句中文的标注。图上的黄色线条就是表示音强,比较明显,每个音节/字,音强线就象一个小帽子,表示

2021-04-25 20:50:44 2964 3

原创 Praat脚本-012 | 绘制平行句语调图

目录引题运行脚本获取脚本关注引题学习了如何提取基频Praat脚本-009 | 提取时长和基频之后,本篇介绍如何通过基频数据绘制很多研究对象对于同一句话的平行句的语调图。这个脚本是Praat脚本-009 | 提取时长和基频的一个变化,09中提取的基频是一个音节一行,而这里需要对多个同样内容的句子,提取的基频序列,画出对比的语调图,所以每一句提取的所有基频需要在同一行,适用的情况如下,给定例子目录里有5句话,是5个人的语音,是同样的内容She is much too busy!,语料来源于http://w

2021-01-12 20:52:15 1000

原创 Praat脚本-011 | 绘制元音分布图

目录引题运行脚本情况一情况二情况三获取脚本关注引题学习了如何提取共振峰(Praat脚本-010 | 提取时长和共振峰)之后,有一个很重要的步骤就是如何将这些数据呈现出来,以表达你的观点或者说明问题。在提取共振峰这一篇文章中,我们已经知道可以简单的根据平均值画出声学元音图,知道你所研究的样本在元音区间内,是如何分布的。本篇会介绍另外一个操作,就是如何绘制元音分布图。元音分布图是利用提取的共振峰数据F1和F2,在坐标图上绘制出所有样本的点,也算是一种散点图,再利用Praat的一个Discriminant功

2021-01-12 20:31:12 4716 4

原创 Praat脚本-010 | 提取时长和共振峰

目录引题提取基频操作解释运行脚本获取脚本关注引题与提取基频的工作类似,提取共振峰也是很常用的一个数据提取操作,共振峰在物理学上称为共振谐波,最典型的例子是我们扔石子到水里,看到的一条一条有规律的水波慢慢展开来,在语谱图上,周期性的浊音,也会产生谐波共振,通过语图上的采样点的描述,我们不但可以清楚的看到这些共振的图形,而且可以通过比较准确的数值来描述出来。共振峰也可以称为Formant。通过第一,第二,第三共振峰可以得到不同元音的分类。通常称为声学元音图。以下来自维基百科。我们如果有足够多的语料,调查

2021-01-11 21:20:25 5398 5

原创 Praat脚本-016 | 计算VC相关的节奏参数

在韵律研究中,有很多学者使用 VC参数相关的参数来描述节奏,VC指的是元音、辅音,这一批参数全部是用在时长的计算,具体的公式是否真的代表了韵律上的某种意义在此不作讨论,有兴趣的朋友可查阅相关的论文。这个脚本是用最新版的Praat6.1.13,因为有一些新的功能老版本未必会有,请务必至官网(http://www.fon.hum.uva.nl/praat/)下载最新版本的Praat。这些新功能可以将标注的内容迅速转化为表格,以及能够一键从这个表格中抽取某一类,比如本脚本需要的V或者C类。请先在Praat里对

2021-01-06 21:59:24 709

原创 Praat脚本-014 | 删除选择区域内的所有边界条

最近更新了几篇有关于在标注数据的时候,便捷的对所选的部分进行删除等操作,今天新增加两个功能即是对选择的区域直接保存为新文件的操作,现将目前四个按钮的功能都一并介绍。新增菜单功能一:见文章[脚本 | Praat自建菜单批量删除边界-简化版]。脚本是:Delete_Selected_Boundary.Praat。标注时删除所选区域的边界条,最新版本已经修改为可以同时删除你标注TextGrid里所有层的边界条。使用前:标注如下,我们选择如图区域,想删除这部分边界条;点击我们自定义的菜单在Boundary菜

2021-01-06 21:49:47 1877

原创 Praat脚本-013 | 无需标注自动切除音频首尾静音段

目录引题提取基频操作解释运行脚本获取脚本关注引题在提取数据的工作中,提取基频这是最重要的一部分,基频也可以称为Pitch, F0。它跟我们感知到的声调,语调是相关的,所以通常用来描述声调语言的声调,以及语调走势等。有关于相关的理论在此不展开,请查阅其它资料。以下图例从论文中摘出。上图针对的声调语言的声调研究,在通过大量的数据提取平均值之后,画出来4个声调调类的基频走势。上图是原始值,下图是归一化到5度的值。描述方法是一样的。从这样的图,我们能够大概知道研究对象的声调趋势情况。同样的道理,我们想研

2021-01-05 21:28:04 1656

原创 Praat脚本-008 | 提取某一层时长

目录引题运行脚本获取脚本关注引题提取时长是提取数据的工作中最基本的,这个脚本的目的其实主要是为了一些脚本爱好者能有一个学习的机会。因为实现起来比较简单。我们以下面的标注文件为例:现在将第一层或者第二层的时长提取出来。运行脚本本文的代码下载地址见下文(获取脚本部分)是08-get_duration_of_one_tier/Get_Duration_of_One_Tier.praat。脚本里有我的邮箱,有任何问题都可以来信咨询。打开Praat之后,选择Praat,Open Praat Scrip

2021-01-05 20:43:47 841 3

原创 Praat脚本-017 |拆分已经标注好的音素为两个音素

目录引题获取脚本关注引题在标注过程中,一批任务标完之后,可能对一些音素重新进行了定义,这时候可能会需要批量将一个音素拆分成两个音素,比如对于双元音,au,拆分成a和u,当然扩展开来,也可以拆成多个音素,本脚本只讨论拆成两个音素的情况。音素被拆分成两个,在标注文件上,边界条也要同步体现,如果有大量的数据,手工完成自然费时费力,这个脚本可以批量进行拆分。对于拆分之后的时间点,是采用的原始音素的中间值,即在原来音素的时长中间点,增加一个边界条。如图所示,拆分后,我们想达到这样的效果。说明:该句样例来自

2021-01-03 14:30:09 1166 1

原创 Praat脚本-018 | Praat批量调整音量

目录引题操作介绍运行脚本获取脚本关注引题要进行语音实验,录音的环节其实是成功的第一步,录音质量、发音人表现、录音内容的设计都是必须要认真对待的,否则最后花了很多精力和财力,最后的实验数据如同鸡肋。但是事实上,无论是在校的研究生,还是公司数据工程师,拿到的数据未必符合以上准则,可能你也没有权利要求重新换一批数据图片。今天的脚本要解决的一个问题是音量问题,你拿到手的音频音量很低,无论是做标注,还是工程做模型,这样的数据都会影响很大。怎么样才能够批量的将所有音频调整音量,而且不要影响到音频本身的音质?操作

2021-01-03 11:35:14 1249 3

原创 Praat脚本-019 | Praat批量修改音频通道数

目录引题运行脚本获取脚本关注引题今天为大家推荐一个脚本,是批量修改音频的通道数量的,有时候由于一些专业录音设备在录音的时候,可能是用的双通道录音的,也称为stereo,当用Praat打开之后,你会发现,波形图显示两部分。右侧显示Ch1和Ch2,代表第一、二通道,通俗的说,就是左右声道。对于做研究写论文标注来说,不太清楚这会不会有太大的影响,但是对于公司做模型等用途,这可能是一些算法限制的必须是单通道的。今天提供的脚本就是批量将双通道转化为单通道。如果你的音频数量不多,在Praat中你可以选择直接读

2021-01-03 10:33:35 1297 1

C#实现数据列作出象Excel的曲线图

该代码实现使用VS2010里面的Chart控件,制作象excel那样的数据图形,在excel中可以对数据进行简单的作图,但是如果这些数据在不同的文件里,打开之后再作图很麻烦,如果结果.Net文件打开的操作,比较方便。

2013-08-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除