Day30 - 模型复杂度分析

在最後一天的内容中,我们会以参数量、乘法数、训练过程中每一个epoch所需的时间测试过程中每一笔资料样本所需的时间来评估静态与动态模型的复杂度。MLP、CNN 及 LSTM-RNN 乘法运算量计算方式如下:

  • MLP:
    其中,M 、N 分别表示输入、输出维度。
  • CNN:
    其中, 分别表示输出特徵图的高、宽与channel 数; 分别表
    示卷积核的高、宽; 则代表输入 channel 数。
    其中,K 、Z 分别表示输入、输出维度。


#hidden layers # parameters # mul. operations training time per epoch test time per data
1 11,705 11,670 1s 0.007s
2 12,635 12,570 1s 0.008s
3 13,565 13,470 1s 0.01s

表1: 静态模型 MLP 复杂度分析

model # parameters # mul. operations training time per epoch test time per data
Basic CNN 24,675 296K 1s 0.014s
Multi-scale CNN 139,805 6.5M 3s 0.035s
Multi-scale CNN with attention 149,405 6.7M 3s 0.045s

表2: 静态模型 CNN 复杂度分析

model # parameters # mul. operations training time per epoch test time per data
LSTM-RNN (last-frame only) 27,389 37,628 423s 0.8s
LSTM-RNN (mean-pooling over time) 27,389 37,628 434s 0.8s
LSTM-RNN with attention 25,675 36,230 215s 0.4s

表3: 动态模型 LSTM-RNN 复杂度分析

这 30 天的语音辨识&语音情绪辨识的旅程就到这边了,感谢大家的阅读&指教,下台一鞠躬!!

