Day08 - 语音特徵撷取 - AFE

AFE 特徵是由欧洲电信标准协会所提出的。

AFE 论文参考连结: https://www.etsi.org/deliver/etsi_es/201100_201199/201108/01.01.03_60/es_201108v010103p.pdf

整体架构如图 1，分为前端(Terminal)与後端(Server)两部份，我们使用的特徵为前端特徵撷取的部份。

图1: 分散式语音辨识系统之进阶前端特徵撷取架构图，分为前端(Terminal)与後端(Server)两部份

在取特徵时会进行降低杂讯(Noise Reduction)等步骤，如图 2，输入的语音讯号会经过以下步骤: 减少噪音、波形处理、倒频谱计算以及盲目均等法，减少噪音是使用维纳滤波器(Wiener filter)将语音讯号经过两个阶段的降噪处理，波形处理全名是SNR-dependent Waveform Processing(SWP)，透过处理语音讯号，目的是强调高 SNR 波形部分并去除低SNR波形部分; 盲目均等法是对讯号中发生的滤波效应进行补偿。

图2: AFE撷取语音特徵的步骤，依序是减少噪音、波形处理、倒频谱计算以及盲目均等法

最後产生的特徵与 MFCC 相同是 39 维(dimension)，包含12个倒频谱系数加上对数能量(log energy)，以及这13个向量的一阶和二阶(delta and delta-delta)导数

产生出了语音特徵之後，我们需要对这些特徵做一些前处理，让模型在使用这些特徵训练时能够有更好的效果。其中一项很重要的前处理过程就是特徵正规化，让我们留到明天再来介绍~

<<: [Day05] Github page

>>: 踏入 LeetCode 的第一步 - 操作与使用

Day08 - 语音特徵撷取 - AFE

[Day23] Esp32 + LINE

Day 0x1D UVa10226 Hardwood Species

[Day12] swift & kotlin 实作篇！(3) 专案架构介绍

[Day 27] Edge Impulse + BLE Sense实现影像分类(上)

不只懂 Vue 语法：Vue 的 MVVM、渐进式框架、宣告式渲染是指什麽？

Android Studio初学笔记-Day1 -大纲介绍

【MusesAI入门】DAY1.注册教学

番外篇（1）一起来做计算机！

Microflows的Java升级版

Day 29. 继续来看组件基础 – Components 吧ヾ(´∀ ˋ)ﾉ