自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (2)
  • 收藏
  • 关注

原创 关于音频情感分类的随笔(6)

随着标记数据的数量不断增长,以及机器学习算法变得更加复杂,音乐情感识别很可能会成为一项越来越准确可靠的技术。

2023-06-25 10:37:19 88

原创 关于音频情感分类的随笔(5)

书接上一篇,通过对少量音频的事后抽查。发现其用的预测算法有误,然后修改了算法,再次对FMA的7997首音频测试。结果没有了Annoying这类分类,应该是训练数据集中的对于这类数据相对较少。对于Nervous分类的,依旧沿用人工检查方式,进行复检。出现153条数据,将准确的数据用不同颜色标识。数据如下: 000615 Nervous 焦虑的 000890 Nervous 焦虑的

2022-12-27 15:47:21 363 6

原创 关于音频情感分类的随笔(4)

连续做了一些小数据量的测试。对于大数据量的测试一直苦于找不到合适数据集而迟迟没有进行。近期利用FMA(音乐分析数据集)最小的数据集(small)其中的4256首30秒的音频从转换到模型建立到最后的预测分析进行了测试。生成了文件,总共耗时3小时完成。其中模型特征提取最为耗时。...

2021-09-07 16:36:17 400 2

原创 关于音频情感分类的随笔(3)

音频情绪分析,音频与共情,回忆性的标注无法准确得到共情当时的情绪

2021-06-23 11:15:38 519

原创 关于音频情感分类的随笔(2)

在关于音频情感分类的随笔(1)中有提到,没有人工标注信息下,采用了无监督学习的分类,作为学习的基础。这样由于缺少黄金标准,导致后续产出的数据,在分析过程中无法甄别出具体的所属情感。那么是不是可以利用人为首先去标注音乐以及音乐片段的情感呢?我个人以为或许不然。其有三个大的方面。 其一音乐是文娱的产物,截止今天,流传的音乐数量很多。如果需要人工标注,需要消耗大量的人力和金钱去投入。对于体量不大的公司以及势单力薄的个人无疑是天方夜谭;其二音乐其实建立在时间的基础上的。音乐的递进...

2020-12-04 11:38:00 355

原创 关于音频情感分类的随笔(1)

整理一下思绪,记录下近期学习和处理的一些信息。算是作为2020年的半年总结。 要快速的吸引或者打动用户,必须实时的唤起用户的情绪共情或者认知共情。个人以为,在短视频上的不知不觉的耗费的时间,是视觉和听觉的双重感官的配合下,唤起观看者的共情,推动停留时间的延长。(个人意见,不喜勿喷,可以讨论)。在不合适的时间选择了不合适的唤起共情的方式,可能会带来倍数增加的反感。例如,2011-6月,*哆哩在成都大面积投放了一组广告。【夕阳西下,恋人送别。一身白裙、头戴草帽的美女与昏黄的色调...

2020-07-08 16:18:29 1583 2

原创 声波信息通讯(三)

第一个版本的声波通讯只是验证了其想法是否能实现。但是在于传输容量,隐蔽性,安全性的平衡上并没有完善的考虑。第一代43bps的嵌入量也很尴尬。在高噪音环境下的鲁棒性也是很尴尬的存在。(当时为了测试高噪音,几次都去酒吧蹦养生迪。得到的结果却惨不忍睹。)为了解决这些问题,当然要改进编解码算法。在目前的实验中,嵌入量可以达到192bps,高噪音环境下能做到自体发音30%左右,达到85%的解码正确率。同时,...

2020-06-18 16:17:23 396

原创 声波通讯的数字滤波选择

声波通讯由于特性的限制,在空气中传播面临着带宽小,干扰源多,接收者方位,播放音量小接收端无法获取等诸多问题。为了解决在高噪下的解码准确度,提升其解码鲁棒性,大多数都会选择数字滤波器,提升准确性。由于空气传播中,对于声波无法通过相位变化增加发送的信息,所以在选择滤波器的时候,首先选择了无限脉冲滤波器(IIR)。在实验中使用了巴特沃斯带通滤波器(Butterworth Filter...

2020-01-08 10:55:30 1373 2

原创 盲识音频分类,非监督和监督联合使用

到了现在提笔忘字的年龄,将东西写下来也算是留下了点痕迹。别想着这个是个浪花,它涟漪都算不上。 之前一个人在折腾着音频信息隐藏的想法。在处理完原始信息压缩后,希望将这些混合有其他信息的音频剥离出来,寻找一下之间的相同之处。由于本人并无乐理知识,耳朵也是一个木耳。对歌曲,音频的也只能听个响,所以根本不能从音频中区别不同的分类。目前对于音频市场的头部公司,从发布到订阅都...

2019-10-16 11:23:16 311

原创 声波通讯中的混音

近期,在慢慢优化声波通讯方面的东西。总觉得其输出的音频对原始的音频修改太大。总想找着一个优秀的混音算法,来解决失真问题。不能因为我是木耳,而忽略了其他用户的使用感官评价。之前我有请几个朋友针对合成后的音频检测过,通过蓝牙音响,耳机。在对比原始音频的情况下,受测者都没有感知出播放音频中的异样。后来有个朋友问我,你哪儿找的音频呀,音质很差的。要不要我给你一个会员,去下写高质量的歌曲。我当时那个汗颜

2018-01-06 09:45:29 470

原创 声波信息通讯(二)

书接上文。声波通讯是建立在数字水印以及信息隐藏的基础上,所以部分要求需要参考这两项的标准。同时,由于空气传播的特性,导致声波通讯时对鲁棒性,不可检测性,以及传输容量的要求特别的高。虽然,自己一直是通过音响+麦克风实验。但是并未采用专业的工具进行攻击的鲁棒性实验。根据推荐,我是用 Stirmark for audio进行攻击测试。AddBrumm:在受测音频中添加蜂鸣声的测试

2017-09-20 15:50:34 1478

原创 声波信息传输

我并不是一开始对声波产生兴趣。只是在一天午休的时候和几个同事聊到一个大学生通过视频中的拨号声音,破解周鸿祎电话的事件的引子。才考虑到其实声音出了沟通之外,还能携带更多的信息。但是声波本身的因素,导致嵌入信息少,传输距离近,以及很容易感知嵌入信息。导致很多想法并不好落地。当然 也有不少先头兵,摩宝网络,蚂蚁支付都相续推出支持声波的支付。个人意淫,可能存在噪音环境下解码率低或者是大众新奇劲过去后,导致

2017-09-04 09:06:00 2314

原创 从EJB容器得到的分布式灵感

一个C#分布式容器的开发日记1.思考由于公司的业务需要,我从DELPHI转向JAVA,,没办法,只有重拾书本.(混口饭,不容易呀)刚才时,自己还有一点抵触的思想,毕竟自己一直都对JAVA没兴趣,不然也不会业余学习DONET了.可是看到EJB时,我突然想到一些东西在delphi中开发分布式程序需要借助MIDAS,一切都基于在DCOM上的东西,虽然便捷,但是不能达到EJB中提出的-

2006-01-14 21:45:00 1049

FMA 7996首音乐的情绪标记

FMA 7996首音乐的情绪标记

2023-07-11

emotify - 音乐情感数据集情感特征数据

该数据来源于:https://download.csdn.net/download/qq_44250700/85378522?spm=1001.2014.3001.5501的音乐集里400首音乐。该音乐集应该是音乐分类的有4种分类,每种100首,每首1分钟。注意:本次提供的数据并未采用人工标注!

2022-05-25

fma small (4257 测试情感标注).xlsx

FMA 隐约集合 small分类下 4257首音频的测试情感标注

2021-09-06

fma small (4257 测试情感标注).xlsx

FMA 隐约集合 small分类下 4257首音频的测试情感标注 有意下载的同学,没有积分的话,请联系我。

2021-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除