Day09 - 语音特徵正规化

当一个模型的训练资料和测试资料,彼此之间的资料分布有不匹配(mismatch)时,模 型的性能会出现大幅的下降。为了减少问题的影响,我们对语音特徵做平均值以及变异数正规化(Cepstral Mean and Variance Normalization, CMVN),让资料之间的分布更为 相似。正规化计算方式如下
https://chart.googleapis.com/chart?cht=tx&chl=%5Chat%7Bx%7D(i)%3D%5Cfrac%7Bx_%7Bt%7D(i)-%5Cmu(i)%7D%7B%5Csigma(i)%7D%2C%5C%201%5Cleq%20t%5Cleq%20T%2C1%20%5Cleq%20i%20%5Cleq%2039
where
https://chart.googleapis.com/chart?cht=tx&chl=%5Cmu(i)%3D%5Cfrac%7B1%7D%7BT%7D%5Csum_%7Bt%3D1%7D%5E%7BT%7Dx_%7Bt%7D(i)%2C%5C%201%5Cleq%20i%5Cleq%2039
https://chart.googleapis.com/chart?cht=tx&chl=%5Csigma%5E%7B2%7D(i)%3D%5Cfrac%7B1%7D%7BT-1%7D%5Csum_%7Bt%3D1%7D%5E%7BT%7D(x_%7Bt%7D(i)-%5Cmu(i))%5E%7B2%7D%2C%5C%201%5Cleq%20i%5Cleq%2039%20

其中,https://chart.googleapis.com/chart?cht=tx&chl=X%3D%5Bx_%7B1%7D%2Cx_%7B2%7D%2C...%2Cx_%7Bt%7D%2C...%2Cx_%7BT%7D%5D 表示一笔音档总共有 T 个音框,https://chart.googleapis.com/chart?cht=tx&chl=x_%7Bt%7D(i) 表示一个音框中第 i 维度的特徵,https://chart.googleapis.com/chart?cht=tx&chl=%5Cmu(i)https://chart.googleapis.com/chart?cht=tx&chl=%5Csigma%5E%7B2%7D(i) 表示第 i 维度特徵的平均值和变异数

使用 python 来实作 CMVN 正规化可以参考以下程序,epsilon 是为了避免分母为 0 的情况
data.shape[0]为资料笔数,data.shape[1] 即为特徵的维度(39)

import numpy as np
def CMVN(data):
    epsilon = 1e-10
	for i in range(data.shape[1]) :
	    mean = np.mean(data[:,i])
		stddev = np.std(data[:,i])
		for k in range(data.shape[0]) :
            data[k,i] = (data[k,i] - mean) / max(stddev, epsilon)
    return data

介绍完语音特徵与正规化前处理之後接着会说明我们的神经网路架构。


<<:  【第七天 - 常见文件泄漏】

>>:  day6_Windows,Linux, MacOs 的虚拟化方案

python os.walk鬼打墙

os.walk 找子目录下特定类型档案,鬼打墙好几天。也写了一两篇po上来,就当是"叠床架...

[ Day 19 ] 表单中的 Controlled Component

在网站开发时有时候会使用到表单的元件,而表单内大多是采用 input 的栏位来搜集使用者的资料的。...

Day03 - 随意玩之 API 讯息内文以及 Sign

今天预计讲解下面两个 (也就是下图的步骤 5) API 的 JSON 内容 把内容加上 Nonce ...

【D3】发现厨房不能用,需要更换厨房环境: 使用Python 3.8

前言 以为很顺畅的,结果发现Python 3.9无法支援,那就只好用3.8罗!因为采了不小的雷,因此...

云端定义 2

本系列文章同步发布於笔者网站 昨天我们介绍了云端的五个必要条件,今天要接续昨天的云端定义,来介绍云端...