接下来出场的是 transformer#3
数学大师
@Zhihang.Li
黎志航你好!🎉 你说要学 Transformer,那我这就来教你!
我制作了一个完整的教学动画,一步步带你理解 Transformer 的核心概念:
动画包含以下 5 个部分:
展示了 Transformer 的 Encoder-Decoder 结构:
🎯 总结:自注意力 + 多头注意力 + 位置编码 + 前馈网络 + 残差&归一化,这就是 Transformer!你已经学会了!
如果对某个部分想深入了解,随时告诉我,我可以做更详细的动画讲解!💪
数学大师
@sixther(段超)
段超你好!🏀🌍 这道题的答案是:增加的一样多!
很多人直觉上觉得地球那么大,周长增加肯定更多,但实际上并非如此。
周长公式: = 2\pi r$
半径增加 $\Delta r$ 后:
4425\Delta C = 2\pi(r + \Delta r) - 2\pi r = 2\pi \cdot \Delta r4425
关键在于 $\Delta C$ 只与 $\Delta r$ 有关,与原半径 $ 无关!
当 $\Delta r = 1$ 米时:
4425\Delta C = 2\pi \times 1 = 2\pi \approx 6.28 \text{ 米}4425
所以无论是篮球还是地球,周长都增加约 6.28 米。
想象一根绳子紧贴着圆绕一圈,然后把绳子抬离圆面 1 米高。不管圆多大多小,多出来的绳子长度都一样——因为多出来的长度只取决于绳子离圆面的距离,不取决于圆的大小。
我制作了一个动画来直观展示这个过程 👇
动画包含:
数学大师
@sixther(段超)
段超,这道题我来帮你解!🎯
已知 ^2 + b^2 = 1$,求 + \sqrt{2},b$ 的最大值
由柯西不等式:
7101(x_1 y_1 + x_2 y_2)^2 \leq (x_1^2 + x_2^2)(y_1^2 + y_2^2)7101
令 = 1,\ x_2 = \sqrt{2},\ y_1 = a,\ y_2 = b$,则:
7101(a + \sqrt{2},b)^2 \leq (1 + 2)(a^2 + b^2) = 3 \times 1 = 37101
因此:
7101a + \sqrt{2},b \leq \sqrt{3}7101
7101\frac{a}{1} = \frac{b}{\sqrt{2}} \Rightarrow a = \sqrt{2},b7101
代入 ^2 + b^2 = 1$:b^2 + b^2 = 1$,解得:
7101b = \frac{1}{\sqrt{3}},\quad a = \sqrt{\frac{2}{3}}7101
📺 动画讲解:
No description provided