当一个模型的训练资料和测试资料,彼此之间的资料分布有不匹配(mismatch)时,模 型的性能会出现大幅的下降。为了减少问题的影响,我们对语音特徵做平均值以及变异数正规化(Cepstral Mean and Variance Normalization, CMVN),让资料之间的分布更为 相似。正规化计算方式如下
where
其中, 表示一笔音档总共有 T 个音框, 表示一个音框中第 i 维度的特徵, 和 表示第 i 维度特徵的平均值和变异数
使用 python 来实作 CMVN 正规化可以参考以下程序,epsilon 是为了避免分母为 0 的情况
data.shape[0]为资料笔数,data.shape[1] 即为特徵的维度(39)
import numpy as np
def CMVN(data):
epsilon = 1e-10
for i in range(data.shape[1]) :
mean = np.mean(data[:,i])
stddev = np.std(data[:,i])
for k in range(data.shape[0]) :
data[k,i] = (data[k,i] - mean) / max(stddev, epsilon)
return data
介绍完语音特徵与正规化前处理之後接着会说明我们的神经网路架构。
>>: day6_Windows,Linux, MacOs 的虚拟化方案
os.walk 找子目录下特定类型档案,鬼打墙好几天。也写了一两篇po上来,就当是"叠床架...
在网站开发时有时候会使用到表单的元件,而表单内大多是采用 input 的栏位来搜集使用者的资料的。...
今天预计讲解下面两个 (也就是下图的步骤 5) API 的 JSON 内容 把内容加上 Nonce ...
前言 以为很顺畅的,结果发现Python 3.9无法支援,那就只好用3.8罗!因为采了不小的雷,因此...
本系列文章同步发布於笔者网站 昨天我们介绍了云端的五个必要条件,今天要接续昨天的云端定义,来介绍云端...