手搓Transformer

最后修改:

思路

位置编码

  • 位置编码(Positional Encoding)用于在序列数据中引入位置信息

多头注意力

前馈神经网络(FeedForward)和层归一化(NormLayer)

Encoder

Decoder

Transformer整体框架

comments powered by Disqus