沿坡向下滚动找到最小值——机器学习的核心引擎
梯度下降通过反复沿最陡下坡方向迈步来找到函数的最小值。梯度(导数)告诉你哪个方向是"下坡",学习率控制每步的大小。
图形显示 f(x) = x⁴ − 3x² + 2,它有两个谷(局部最小值)。从某个点出发,算法沿坡一步步向下,直到到达谷底。这正是神经网络的学习方式——在损失曲面上"向下滚动"。
试着问 AI "从 x = 2 开始下降" 或 "学习率过大会发生什么?"