【19】使用 Pooling 和 Conv 来把图片变小 (subsampling) 的比较实验

Colab连结

早期刚学深度学习时，我们 AlexNet 学到了几个基本的 CNN, Dense, Pooling, Dropout Layers，其中 Pooling 又有 Max 和 Avg 两种版本，但现代的模型中，我们越来越少看到 Pooling Layer 的存在(Global Pooling 不算)，近期取而代之的是将多数的 Layer 尽量利用 CNN 来搞定，这样既可以降低下采样(subsampling)，同时还多了几个权重让模型去学习，当然，这麽做的代价就是预算比较复杂些。

今天要来做的实验是比较 MaxPooling vs AvgPooling vs Conv 三种用来作为 down sampleing 手段的比较。

资料集我们采用 beans，共有三种分类，辨别叶片的健康状况。

NUM_OF_CLASS = 3

ds_data, ds_info = tfds.load(
    'beans',
    shuffle_files=True,
    as_supervised=True,
    with_info=True,
)

train_split, test_split = ds_data['train'], ds_data['test']


fig = tfds.show_examples(train_split, ds_info)

print(f'number of train: {len(train_split)}')
print(f'number of test: {len(test_split)}')

实验一，使用 MaxPooling

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, BatchNormalization, Activation, MaxPooling2D, AveragePooling2D, Flatten, Dense

def alexnet_modify_max_pooling():
  model = Sequential()
  model.add(Conv2D(32, (11, 11), padding='valid', input_shape=(227,227,3)))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(MaxPooling2D(pool_size=(3, 3)))

  model.add(Conv2D(64, (7, 7), padding='valid'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(MaxPooling2D(pool_size=(3, 3)))

  model.add(Conv2D(96, (3, 3), padding='valid'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(MaxPooling2D(pool_size=(3, 3)))

  model.add(Conv2D(64, (3, 3), padding='same'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(MaxPooling2D(pool_size=(3, 3)))

  model.add(Flatten())
  model.add(Dense(128))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Dense(64))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Dense(NUM_OF_CLASS))

  return model

产出:

EPOCH 172/200
loss: 0.0015 - sparse_categorical_accuracy: 1.0000 - val_loss: 0.7871 - val_sparse_categorical_accuracy: 0.8438

实验二，使用AvgPooling

def alexnet_modify_avg_pooling():
  model = Sequential()
  model.add(Conv2D(32, (11, 11), padding='valid', input_shape=(227,227,3)))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(AveragePooling2D(pool_size=(3, 3)))

  model.add(Conv2D(64, (7, 7), padding='valid'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(AveragePooling2D(pool_size=(3, 3)))

  model.add(Conv2D(96, (3, 3), padding='valid'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(AveragePooling2D(pool_size=(3, 3)))

  model.add(Conv2D(64, (3, 3), padding='same'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(AveragePooling2D(pool_size=(3, 3)))

  model.add(Flatten())
  model.add(Dense(128))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Dense(64))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Dense(NUM_OF_CLASS))

  return model

产出:

EPOCH 155/200
loss: 0.0060 - sparse_categorical_accuracy: 0.9990 - val_loss: 0.7398 - val_sparse_categorical_accuracy: 0.8438

得出的成果和实验一的 MaxPooling 差不多。但两者的准确度上升图表可以看到 MaxPooling 较为稳定，AvgPooling 在中後期准确度仍有低至50%的情况发生。

实验三，使用 Conv(strides=3) 取代 Pooling。

def alexnet_modify_conv_replace_pooling():
  model = Sequential()
  model.add(Conv2D(32, (11, 11), padding='valid', input_shape=(227,227,3)))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Conv2D(32, (3, 3), strides=(3, 3), padding='valid'))

  model.add(Conv2D(64, (7, 7), padding='valid'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Conv2D(64, (3, 3), strides=(3, 3), padding='valid'))

  model.add(Conv2D(96, (3, 3), padding='valid'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Conv2D(96, (3, 3), strides=(3, 3), padding='valid'))

  model.add(Conv2D(64, (3, 3), padding='same'))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Conv2D(64, (3, 3), strides=(3, 3), padding='valid'))

  model.add(Flatten())
  model.add(Dense(128))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Dense(64))
  model.add(BatchNormalization())
  model.add(Activation('relu'))
  model.add(Dense(NUM_OF_CLASS))

  return model

产出

EPOCH 194/200
loss: 7.5052e-04 - sparse_categorical_accuracy: 1.0000 - val_loss: 1.0053 - val_sparse_categorical_accuracy: 0.7734

从结果的准确度来看，使用 Conv 取代 Pooling 并没有比 Pooling 准确度来的高，当然可以再尝试的地方就是将 Flatten 取代成 Global Pooling 并把後面的 Dense 拿掉，但是今天的测试纯属想知道只更换 Pooling 会产生什麽样的变化，就做了这样的实验罗。

<<: JavaScript学习日记 : Day21 - 数组方法(一)

>>: Day19｜【Git】开始使用分支 - git branch（基本常用指令）

【19】使用 Pooling 和 Conv 来把图片变小 (subsampling) 的比较实验

【第二三天 - Flutter iBeacon 官方范例讲解（上）】

那些被忽略但很好用的 Web API / Geolocation

Flutter体验 Day 28-flame JoystickComponent

Day8 Android - 切换页面(Intent)

[Day 27] markdown 的网址分享可不可以简单一点阿

Day 03：转吧转吧七彩霓虹灯之 p10k

Day-5 Excel自动填满的奥妙

02 - Rectangle - 视窗管理工具

[第二十四只羊] 迷雾森林舞会XVIII 游戏角色设定again_final_final

寻找mail server