一步一步深入浅出解释Transformer原理

1.Input Embedding 就是将输入的句子给映射成向量。 2.加入位置编码 对于a56爆大奖在线娱乐奇数时间步,使用余弦函数创建一个向量。对于a56爆大奖在线娱乐偶数时间步,使用正弦函数创建一个向量。然后将这些向量添加到相应的嵌入向量。 因为Transformer没有像RNN一样的递归,a56爆大奖在线娱乐a56爆大奖在线娱乐们必须将位置信息添加到输入嵌
posted @ 2023-09-20 11:58  哎呦哎(iui)  阅读(295)  评论(0编辑  收藏  举报