码农深度学习🧮Tokenizer本页总览🧮Tokenizer 大语言模型LLM基础之Tokenizer完全介绍_哔哩哔哩_bilibili 👾Transformer 手撕 Self Attention 手写self-attention的四重境界-part1 pure self-attention_哔哩哔哩_bilibili MHA PyTorch手写多头注意力(Multi-Head Self-Attention)-- Self Attention 四重境界 part2(面试常考)_哔哩哔哩_bilibili Decoder 一个视频讲清楚 Transfomer Decoder的结构和代码,面试高频题_哔哩哔哩_bilibili transformer中的attention为什么scaled? - 知乎 拆解Transformer模型!_哔哩哔哩_bilibili 浅谈位置编码(RoPE) - 王冰冰 - 博客园 transformer中位置编码的理解_哔哩哔哩_bilibili Transformer学习笔记一:Positional Encoding(位置编码) - 知乎 🎛️位置编码 绝对位置编码 VS 相对位置编码 Sinusoidal(绝对) RoPE(即相对又绝对 但是相对)