O algoritmo que ensina a IA a aprender
A descida de gradiente encontra o mínimo de uma função dando passos na direção oposta ao gradiente (inclinação). A fórmula é x_{n+1} = x_n − α · f'(x_n), onde α é a taxa de aprendizado — o tamanho do passo.
O gráfico mostra f(x) = x⁴ − 3x² + 2, uma função com dois mínimos locais. Partindo de diferentes posições, a descida de gradiente pode convergir para mínimos diferentes. Isso ilustra um desafio central no aprendizado de máquina: mínimos locais versus mínimo global.
Peça à IA "Execute descida de gradiente partindo de x = 2" ou "O que acontece com taxa de aprendizado muito alta?"