【Day3】声音的特徵提取

梅尔倒频谱

昨天我们介绍了频谱跟梅尔频率,那有没有机会我可以把这两个结合在一起,获得更有用的资讯呢?

没有错拉

我们只要把频谱转换到梅尔刻度上就可以得到很基础的梅尔倒频谱,

幸运的是我们可以不用那麽麻烦,因为 librosa 都帮你做好了。

梅尔倒频谱系数

有了梅尔倒频谱之後,我们还是能够继续简化它,梅尔倒频谱系数就是一组用来建立梅尔倒频谱的关键系数,它通常是 13 维的资料

这是因为丢弃高维的系数,就像是一个低通滤波器,可以使讯号平滑化,增进语音处理的性能

取得系数的方法,如果你想要自己算的话,就是把梅尔倒频谱再做一次倒频谱,但 librosa 已经帮你做好了

(更详细的作法,你可以参考这篇)

mfcc = librosa.feature.mfcc(wave,sr=sr, n_mfcc=13)

你也可以随时把它转回来

 librosa.feature.inverse.mfcc_to_mel(mfcc)

过零率

过零率是指一个信号的正负号变化的比率,这个特徵在音乐分类的任务上是敲击声的关键特徵

实际看一下资料就可以感受到了

频谱质心

它可以用来表达每个音框的频率分布以及趋势,每个音框都会计算出一个特徵值,

在分析一段声音时,我们通常将音讯切成比较短的单位,就叫音框

如果这个值越低就说明越多的能量在低频,反之亦然。

实际看一下资料就可以感受到了

librosa.feature 里头还有一些其他 feature,但比较难去找实际的资料来说明,像是 Tonnetz 这个可能跟乐理以及音调有关系。

小结

今天我们学到了一些声音的特徵,还有提取的方法,那明天就来实作一个简单的音乐分类器吧!

/images/emoticon/emoticon09.gif/images/emoticon/emoticon13.gif/images/emoticon/emoticon14.gif/images/emoticon/emoticon22.gif/images/emoticon/emoticon28.gif


<<:  【第三天 - Stack 题目分析】

>>:  【Python Flask 入门指南】轻量级网页框架教学 | 5 行程序码 x 架设网站

Day 17 「提枪上阵」在测试保护下重构出 State 设计模式

报告班长,图片截自网路 大家有听过「报告班长」吗?这部 1987 年的电影,当年推出後一炮而红,带...

[Day15]汇总函数(分组函数)

汇总函数是以多笔资料列为基础,输入的资料列经过函数运算後,一组只会输出一个值,基本特性如下: 可将一...

Day8 - 如何读取委托回报、成交回报

你还在看,真有心,来吧! 我们一起牵手向前行! 读取委托回报,通常下单(raplace order)...

Day 15 | Flutter web 环境安装 与 vs code插件

Flutter SDK 这里以 MacOS 作为范例 首先到官网https://flutter.de...

Day22 CSS版型设计完成网页!

前面的几篇文章已经让我们可以完成一个属於你的网页!包括从页首、网页内容、页尾、排版,这些所教的工具如...