Day08 - 语音特徵撷取 - AFE

AFE 特徵是由欧洲电信标准协会所提出的。

AFE 论文参考连结: https://www.etsi.org/deliver/etsi_es/201100_201199/201108/01.01.03_60/es_201108v010103p.pdf

整体架构如图 1,分为前端(Terminal)与後端(Server)两 部份,我们使用的特徵为前端特徵撷取的部份。
https://ithelp.ithome.com.tw/upload/images/20210918/20140944u5AQCJtsqq.png
图1: 分散式语音辨识系统之进阶前端特徵撷取架构图,分为前端(Terminal)与後 端(Server)两部份

在取特徵时会进行降低杂讯(Noise Reduction)等步骤,如图 2,输入的语音讯号会经过以下步骤: 减少噪音、波形处理、倒频谱计算以及盲目均等法,减少噪音是使用维纳滤波器(Wiener filter)将语音讯号经过两个阶段的降噪处理,波形处理全名是SNR-dependent Waveform Processing(SWP),透过处理语音讯号,目的是强调高 SNR 波形部分并去除低SNR波形部分; 盲目均等法是对讯号中发生的滤波效应进行补偿。
https://ithelp.ithome.com.tw/upload/images/20210918/20140944HleMNMNjQm.png
图2: AFE撷取语音特徵的步骤,依序是减少噪音、波形处理、倒频谱计算以及盲目 均等法

最後产生的特徵与 MFCC 相同是 39 维(dimension),包含12个倒频谱系数加上对数能量(log energy),以及这13个向量的一阶和二阶(delta and delta-delta)导数

产生出了语音特徵之後,我们需要对这些特徵做一些前处理,让模型在使用这些特徵训练时能够有更好的效果。其中一项很重要的前处理过程就是特徵正规化,让我们留到明天再来介绍~


<<:  [Day05] Github page

>>:  踏入 LeetCode 的第一步 - 操作与使用

Android Studio初学笔记-Day1 -大纲介绍

这是我第一次参加这种撰写文章的比赛,参加这个比赛主要是让我能保持学习并透过写文章分享自己的学习历程,...

【MusesAI入门】DAY1.注册教学

身为管理者的您是否觉得已经建立详细作业程序,但产品品质却不符合预期? 工厂作业员每天一直在做动作重覆...

番外篇(1)一起来做计算机!

距离完赛已经过了一阵子,前天想自己刻刻看计算机,拆解任务、实际执行後才发现知识量不足,导致无法顺利完...

Microflows的Java升级版

在写Java以前想一下 在决定用Java解决问题前,其实很多功能在内建的Microflows中都能够...

Day 29. 继续来看组件基础 – Components 吧ヾ(*´∀ ˋ*)ノ

欧欧欧,竟然已经到第29天了,时间真的是咻咻咻就过了呢!明天就要结束了,真是感伤(☍﹏⁰) (解脱了...