손실함수의 필요성에 대한 직관적인 이해

  • 모델을 학습할때 정확도가 아닌 굳이 손실함수를 쓰는 이유가 있음
  • 최적의 매개변수인 가중치와 편향을 찾아내야 하는데, 손실함수의 값을 가장 작게 하는 매개변수 값을 찾아야 함
  • 그래서 미분값을 단서로 매개변수의 값을 서서히 갱신하는 과정을 반복해야함
  • 정확도가 기준이 되면 미분값이 대부분의 장소에서 0이 되어 매개변수 갱신 불가.
  • 예를들어 정확도는 여러개의 분류 문제가 있을때 불연속적으로 바뀌기 때문에 아무리 기울기를 계산해서 움직여도 개선되지 않음.

답글 남기기