Day 27 利用transformer自己实作一个翻译程序(九) Point wise feed forward network

Point wise feed forward network

在两层全连阶层中加入一个relu的激活函数

def point_wise_feed_forward_network(d_model, dff):
  return tf.keras.Sequential([
      tf.keras.layers.Dense(dff, activation='relu'),  # (batch_size, seq_len, dff)
      tf.keras.layers.Dense(d_model)  # (batch_size, seq_len, d_model)
  ])
sample_ffn = point_wise_feed_forward_network(512, 2048)
sample_ffn(tf.random.uniform((64, 50, 512))).shape
TensorShape([64, 50, 512])

<<:  [Day 12] 阿嬷都看得懂的 CSS 收整与 DRY 策略

>>:  【第12天】训练模型-Learning Rate

pip install安装套件时遇到『use_2to3 is invalid』错误

使用pip install安装ConcurrentLogHandler时遇到以下错误: error ...

Day 11 阿里云架设网站-DNS & 智能流量分流

云解析(Alibaba Cloud DNS) 云解析是一个在阿里上的DNS托管工具,每个云端都有他自...

什麽是帕累托图?(20/80法则)

我相信您曾经有过这样的经历。当您遇到问题并想解决时,您总是会发现有太多因素会影响该问题。太多了,您根...

【第十六天 - 动态规划 介绍】

Q1. 动态规划(Dynamic Programming)是什麽 ? Dynamic program...

[DAY 06] CheckBoxItem

题型为多选题的题目 可以用gogole form 中的「核取方块」出题 特徵为在预览模式中 选项前为...