Question 1

경사 하강법이란 무엇인가요?

Accepted Answer

함수의 최솟값을 반복으로 찾는 최적화 알고리즘입니다: x_{n+1} = x_n − α · f'(x_n) (α는 학습률). 각 단계에서 기울기의 반대 방향(내리막)으로 이동합니다.

Question 2

학습률이란 무엇인가요?

Accepted Answer

학습률 α는 단계 크기를 조절합니다. 너무 작으면 수렴이 느리고 많은 단계가 필요합니다. 너무 크면 최솟값을 지나쳐 발산할 수 있습니다. 적절한 학습률을 찾는 것이 머신러닝의 핵심 과제입니다.

Question 3

지역 최솟값과 전역 최솟값의 차이는?

Accepted Answer

지역 최솟값은 주변보다 낮은 골짜기이지만 절대적인 최저점이 아닐 수 있습니다. 전역 최솟값은 전체에서 가장 낮은 점입니다. 경사 하강법은 지역 최솟값에 갇힐 수 있습니다 — 국소적인 경사만 볼 수 있기 때문입니다.

Question 4

머신러닝에서 어떻게 사용되나요?

Accepted Answer

신경망에는 예측 오류를 측정하는 "손실 함수"가 있습니다. 경사 하강법은 이 손실을 최소화하기 위해 모델의 파라미터를 조정합니다 — 말 그대로 고차원 지형에서 내리막으로 굴러가는 것입니다. 우리가 사용하는 모든 AI 모델은 이 방식으로 훈련되었습니다.

경사 하강법