自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 Multi-modal speech emotion recognition using self-attention mechanism and multi-scale fusion framwor

《基于自注意机制和多尺度融合框架的多模态语音情感识别》(Multi-modal speech emotion recognition using self-attention mechanism and multi-scale fusion framework)

2022-10-19 23:43:36 1717 1

原创 用python实现语音的分割并保存为.wav文件

用python实现语音的分割并保存为.wav文件

2022-09-25 18:13:06 4001

原创 在Python上用openSMILE提取IS09和eGeMAPS特征集

在Python上用openSMILE提取IS09和eGeMAPS特征集

2022-09-22 13:19:51 2151 9

原创 使用Latex输入藏文字符

Latex显示藏语文字或藏文字符。

2022-09-18 23:05:03 688

原创 解决pycharm运行程序时报错:This application failed to start …… plugin “windows

解决This application failed to start because it could not find or load the Qt platform plugin “windows”

2022-07-11 16:04:14 1260

原创 小语种语音情感语料库的建立——论文阅读1

分享一篇小语种语音情感语料库建立的论文A new Amharic emotion data set and classification benchmark

2022-07-06 17:54:42 943

原创 Graph Isomorphism Network for Speech Emotion Recognition论文笔记

该论文来自于华南理工大学的研究者发表于interspeech2021上,作者首次将GIN网络用于实现SER,得到比以往的网络更好的性能。

2022-05-31 12:01:30 435

原创 解决ValueError: Tensor‘s shape (5, 5, 3, 6) is not compatible with supplied shape (5, 5, 3, 10)

解决ValueError: Tensor's shape (5, 5, 3, 6) is not compatible with supplied shape (5, 5, 3, 10)

2022-04-03 21:53:51 3007 4

原创 语音预处理之分帧加窗

语音信号为非平稳信号,其统计属性是随着时间变化的,语音又具有但是平稳的属性,在一个发音单元里,语音信号表现出明显的稳定性、规律性,在进行语音识别时,对于一句话识别的过程也是以较小的发音单元(音素、字、字节)为单位进行识别的,因此需要分帧加窗来提取短时片段。

2022-01-18 00:47:31 8817 5

原创 语音预处理之预加重

语音经发声者的口唇辐射发出,空气作为语音信号传播的介质,在传播声音信号能量的同时也消耗能量,语音信号的频率越高,介质对声音能量的损耗越严重,预加重能在一定程度上弥补高频部分的损耗,保护声道的信息。

2021-12-23 10:21:06 9423 5

原创 语音识别基础知识二

1、声波的特性声波在空气中是一种纵波,它的振动方向和传播方向是一致的。声音在空气中的震动形成压力波,产生压强,经过传感器接受转化,变成时变的电压信号。声波的特性主要包括频率和声强。某一瞬间介质中的压强相对于无声波时压强的改变量称为声压,记为p(t),单位时Pa。声压级(sound pressure level, SPL),一般把很小的声压p0=2X10^(-5)Pa作为参考声压,把所要测量的声压p与参考声压的比值取对数后,乘以20得到的数值称为声压级。国家标准规定住宅区白天的噪音不能超过

2021-12-22 16:09:25 2707

原创 语音识别基础知识一

1、人耳组成的三部分:外耳:外耳包含耳翼和外耳道,耳翼具有定向作用,外耳道同其它管道一样也有共振频率,大约是3400Hz。鼓膜位于外耳道内端,声音的振动通过鼓膜传到内耳。中耳:由三块听小骨组成,作用包括放大声压和保护内耳。中耳通过咽鼓管与鼻腔相通,其作用是调节中耳压力。内耳:耳蜗实现声震动到神经冲动的转换,并传递到大脑。2、听觉特性与音频信号2.1人的听觉特性①人对声音强弱的感觉通过对人群测试发现,当声音信号的强弱按指数规律增长时,人会大体上感到声音在均匀地增强,即将声音声强取对

2021-12-20 23:46:48 3603

原创 安装kaldi时遇到:you may not have installed OpenFst. See ../tools/INSTALL ***……已解决

在运行该语句extras/check_dependencies.sh得到下列结果时:extras/check_dependencies.sh: all OK.按照网上的教程,该输入make -j 4执行完这条语句后,就该切换目录,然后继续下一步:./configure --shared,此时就报错了如下:XXX:~/kaldi$ cd srcXXX:~/kaldi/src$ ./configure --sharedConfiguring KALDI to use MKL.Check

2021-08-21 19:57:43 2826 2

原创 语音信号的短时平均过零率

一、短时平均过零率的作用1、对于连续语音信号,可以考查其时域波形通过时间轴的情况;2、对于离散信号,实质上就是信号采样点符号变化的次数;3、在一定程度上可以反映出频率的信息,比如正弦信号的平均过零率就是信号的频率除以两倍采样频率,而采样频率是固定的,所以根据短时平均过零率得出正弦信号的频率。二、短时平均过零率的定义1、过零率  单位时间内信号通过零值的次数就称为过零率。2、短时平均过零率  短时平均过零率是语音信号时域分析中最简单的一种特征,一段短时间内的过零率称为短时平均过零率,这里的短时

2021-05-23 10:18:27 5532 1

原创 语音信号的短时能量

一、短时能量的作用1、短时能量可以区分清音和浊音,因为浊音的能量要比清音的大得多;清音:释义是轻柔的声音;发音时声带不振动的音,如p、t、k (pa, te , ke)浊音:将发音时声带振动的音称为浊音,如b、d、g (ba, de, ge)2、对声音段和无声段进行判定;3、对声母和韵母分界;4、连字的分界等。二、怎么计算短时能量1、短时能量的定义对于信号{x(n)},其短时能量的定义如下:En 表示在信号的第n个点开始加窗函数时的短时能量,窗函数可选矩形窗和汉明窗等;短时能量可以看作

2021-05-18 15:10:57 9053 6

原创 一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,求该数

题目来源:菜鸟教程题目:一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,请问该数是多少?问题分析解这道题都需要先好好分析一下,它的数学逻辑,根据题目可以得出n + 100 = x2 -----------------①n + 100 +168 = y2----------②可以化简为y2 -x2 =168(y-x)(y+x) =168不难得出 y+x<=168---------③将③带入③(因为带入③对应的n值更小)可以得出 n要小于 1682-

2021-03-17 13:58:06 24268 5

原创 Python实现企业发放奖金总数

题目表述企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%;利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可提成7.5%;20万到40万之间时,高于20万元的部分,可提成5%;40万到60万之间时高于40万元的部分,可提成3%;60万到100万之间时,高于60万元的部分,可提成1.5%,高于100万元时,超过100万元的部分按1%提成,从键盘输入当月利润I,求应发放奖金总数?问题分析这其实是一个简单的数学问题,首先看输入的金额

2021-03-16 16:48:37 5595

原创 Ubuntu使用笔记

本文主要用于记录在使用Ubuntu20的过程中遇到的一些问题,以及解决的方法。一、问题1、如何实现全屏?二、解决方法1、Ubuntu实现全屏的方法

2021-02-15 16:56:57 217 1

原创 数据结构和算法学习笔记

数据结构和算法一、什么是数据结构和算法绪论1、什么是数据结构?数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。程序设计 = 数据结构 + 算法简单来说数据结构就是关系,元素相互之间存在的一种或多种特定关系的集合。1.1 逻辑结构和物理结构传统上,我们把数据结构分为逻辑结构和物理结构。a.逻辑结构是指数据对象中数据元素之间的相互关系,也就是我们今后最需要关注和讨论的问题。(1)集合结构:集合构成中的元素除了同属于一个集合外,它们之间没有其他关

2021-01-31 15:45:58 102

原创 用C语言实现整数(范围-2^32-- 2^32 -1)的反转

问题描述:给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。假设我们的环境只能存储得下 32 位的有符号整数,则其数值范围为 [−231,231 − 1]。请根据这个假设,如果反转后整数溢出那么就返回 0。分析问题:代码实现及结果:...

2020-12-24 15:29:38 308

原创 为什么python编译fourth = raw.input(‘Year: ‘)[3]时会报错

最近在学习Python,我用的是教材是:Python基础教程(第二版)作者是[挪]Magnus Lie Hetland 由司维 增军崴 谭颖华翻译。我现在使用的Python版本为:Python 3.8.5。在学习第二章列表的时候发现用python编译fourth = raw.input('Year: ')[3]会报错,编译器提示Traceback (most recent call last): File “<pyshell#14>”, line 1, in fourth = raw.inp

2020-12-09 22:44:36 146

原创 使用Python实现在0-100内的猜数字游戏

**要求大概如下:**使用Python语言实现一个猜数字游戏,数字的范围是在0-100的整数(可以为其他某个范围),猜数字的次数可以可以为无限次,或者为有限次数。分析问题,主要需要解决的问题如下:1、怎么产生随0-100的随机整数?引入随机数包,调用函数实现import randomnumber = random.randint(0,100) //范围可以在括号里修改2、怎么判断用户输入的数字是否在0-100的范围内?通过if语句进行判断,首先判断用户输入的数字是否大于或小于某个值,这里是

2020-12-07 13:16:26 19201 1

原创 Python学习笔记

2020-12-05学习笔记一、“+”和“”在print()里的作用 print(A+B)1、如果A、B均为数字,则该语句先进行加法再输出想加的结果 如:print(6+6) 输出结果为:12。2、如果A、B均为字符串,则改语句的作用是进行拼接,如:print(“I love” + “you”) 输出结果为 I love you。3、如果A、B中有一个为字符串有一个为数字,结果会报错,不可以这样写。二、“”在print()里的作用print(“hello\n”*6) 结果是将hello\n打印

2020-12-06 22:47:19 1455

原创 使用orCAD Library Builder建立TO-220的封装

如何使用orCAD Library Builder建立TO-220的封装

2020-07-16 21:25:02 2006

原创 使用C语言实现对用户输入的字符串进行分类

问题描述:让用户随机输入一个字符串,然后用C语言实现对字符串里的字符分类,一般可分为 大写字母、小写字母、数字、空格、或者其它字符(标点符号%……*等)。用户输入为:qwe12SADCr1234,./;'输出应为:大写:4 小写:4 数字:6 其他:5方法一:C语言的一个头文件<ctype.h>,定义了一批C语言字符处理函数,用于测试字符是否属于特定的字符类别,...

2020-04-25 23:31:36 2741

原创 用C语言实现最大公约数和最小公倍数

题目描述:在一个程序里用C语言求出用户输入来两个数的最大公约数和最小公倍数。例如用户输入为7 9则输出应为1 63代码如下#include<stdio.h>void maxdivisor(int m,int n);//求最大公约数 void lowstmultiple(int m,int n);//求最小公倍数 int main(){ int a...

2020-04-24 18:49:59 600

原创 汉诺塔问题基于C和Python实现

问题描述汉诺塔问题的来源汉诺塔:汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵天命令婆罗门把圆盘从下面开始按大小顺序重新摆放在另一根柱子上。并且规定,在小圆盘上不能放大圆盘,在三根柱子之间一次只能移动一个圆盘。简单来说,有三颗柱子A,B,C,起初A上有n个盘子,想办法把柱A上的盘子全部...

2020-03-30 23:14:26 940

原创 用C语言实现输入一个九宫格数组,用代码输出它的某一行和某一列,并保留原有的格式

问题描述让用户输入一个9个数字,把用户输入的数字表示成九宫格(三维数组)的形式,输出数组的某一行或者某一列。代码实现假如输入的数字为1-9,要求输出的为这个九宫格的第一行和第一列。#include<stdio.h> //1 2 3 4 5 6 7 8 9int main(){ int a[9]={0}; int i,j,k,b[3][3]={0}; printf("...

2020-03-23 12:11:10 1642

原创 用C语言求3行4列数组中的最大数并输出最大数和它所在的行和列

实现思路实现时需要考虑数组里有没有相同的最大数。若无相同的数如果没有相同的数,首先通过for循环找到最大值,把它赋值给某一个变量,同时把它所在的行和列也赋值给另外两个变量。若有相同的数首先通过for循环找到最大值,把它赋值给某一个变量,把它所在的行和列也赋值给另外两个变量,同时也需要记录把与最大值相同的数拿出来单独分析,如果它与最大值也想等,那么同样输出它的行和列。代码实现如下#in...

2020-03-23 09:47:49 7755 2

原创 用C语言实现求几个同学各科的平均分和总平均分

已知五位同学的物理、化学、生物三科的分数分别如下:周80,75,92武61,65,71正59,63,70王85,87,90李76,77,85请用代码输出 1/各科的平均分 2/各自的总分 3/总平均分。#include<stdio.h>/*周80,75,92武61,65,71正59,63,70王85,87,90李76,77,85求分科成绩的平均成绩和...

2020-03-21 22:07:13 6634 1

原创 用C语言求用户输入的n个数中的最大值

#include<stdio.h>int main(){ int n,i; float x,max; printf("请输入数字的个数:"); scanf("%d",&n); printf("请输入%d个数字\n",n); max=-1e30;//-1e30仅仅是为了取一个尽量小的值 for(i=0;i<n;i++) { scanf("%f",&...

2020-02-13 11:23:55 28933 7

原创 C语言入门第一个程序

原题链接请参照本章例题,编写一个C程序,输出以下信息:**************************Hello World!**************************Hello与World之间有一个空格*也是输出的一部分,别光打印Hello World!第一种方法三行打印就可以了,缺点是*的个数要每一个都敲进去有点麻烦不过语句简单。#include...

2020-02-12 10:09:09 150

原创 用C语言实现:输入某年某月某日,判断这一天是这一年的第几天

首先考虑要用到switch语句,因为有十二个月份,如果用if语句太过于复杂在switch里面,进行一个简单的加法就可以计算出是几天了;当然我们必须考虑是否是润年,这里只要记得瑞年的判断语句,就比较简单,因为它们只相差一天,所以使用if语句就可以进行输出了,代码如下:#include<stdio.h>// 输入某年某月某日,判断这一天是这一年的第几天//这是又缺陷的,没有仔...

2019-05-12 23:52:01 36133 20

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除