Day14 - 模型评估 part 1

在今天的文章中我们会使用词正确率来评估模型的效能，词正确率是由词错误率(Word Error Rate, WER)转换後得到。为了计算词错误率，我们将预测出的结果以及正确的结果计算其取代错误(Substitution error, S)、删除错误(Deletion error, D)、插入错误(Insertion error, I)的数量，词错误率的计算方式如下：
$https://chart.googleapis.com/chart?cht=tx&chl=WER%3D%5Cfrac%7BS%2BD%2BI%7D%7BN%7D%5Ctimes%20100%5C%25$
其中 N 表示正确答案的总词数，因此词正确率就等於
$Word Correct Rate = 1-WER$

我们将语音特徵不经过除噪模型，直接用於辨识得到的结果作为基准(baseline)。在 Day09 时有提过会对语音特徵做 CMVN 正规化，并使用高斯混合模型(HMM-GMM) 和 CTC 模型作後端的语音辨识。baseline 结果如表 1、表 2，使用 AFE 特徵在乾净的训练资料下，HMM-GMM 的词正确率是83.17%，CTC 模型是84.91%，含有噪音的训练资料，HMM-GMM 和CTC 模型的词正确率分别是 91.77% 和 92.71% ；而在 MFCC 特徵方面，在乾净的训练资料下，HMM-GMM 的词正确率是78.32%，CTC 模型是78.31%，含有噪音的训练资料，HMM-GMM 和 CTC 模型的词正确率分别是 89.88% 和 90.77%。

语音特徵	辨识模型	词正确率
AFE	HMM-GMM	83.17%
AFE	CTC	84.91%
MFCC	HMM-GMM	78.32%
MFCC	CTC	78.31%

表 1: 乾净的训练资料 baseline

语音特徵	辨识模型	词正确率
AFE	HMM-GMM	91.77%
AFE	CTC	92.71%
MFCC	HMM-GMM	89.88%
MFCC	CTC	90.77%

表 2: 含有噪音的训练资料 baseline

从结果中可以发现，因为测试资料是含有噪音的，所以使用乾净的训练资料训练的模型词正确率会比使用含有噪音的训练资料来得差。
明天会将 baseline 的结果跟加入除噪模型後的结果做比较，了解除噪模型的效能。

<<: 【第十二天 - 报错型 SQL注入】

>>: 【Day11】HomeFragment X RecyclerView X Firestore取/删除资料

Day14 - 模型评估 part 1

<Day13> Ticks — 取得股票(Stock)逐笔成交资料

[Day28] 平常用不到但又常常需要的缩网址+QRcode产生器

D19-(9/19)-巨大(9921)-不只是台湾单车龙头，也是世界龙头

Day 4 [Python ML] 模型验证

【Day.26】React进阶 - useEffect v.s useLayoutEffect

2.4.17 Design System - Tooltip

Day 13：巢状路由的孩子－Nested Routes

[day23]加入购物车 & 库存检查

Day-28 说明什麽是 Migration ?

予焦啦！Hello World 与 Uart 机制观察