沿坡向下滾動找到最小值——機器學習的核心引擎
梯度下降透過反覆沿最陡下坡方向邁步來找到函數的最小值。梯度(導數)告訴你哪個方向是「下坡」,學習率控制每步的大小。
圖形顯示 f(x) = x⁴ − 3x² + 2,它有兩個谷(局部最小值)。從某個點出發,演算法沿坡一步步向下,直到抵達谷底。這正是神經網路的學習方式——在損失曲面上「向下滾動」。
試著問 AI 「從 x = 2 開始下降」 或 「學習率過大會發生什麼?」