분류 모델의 성능을 평가하기 위해서 주로 Accuracy, Precison, Recall 등을 사용한다.
회귀 모델의 경우 다음과 같은 방식을 사용하여 모델을 평가한다.
우리가 오차들을 계산할때 각 오차들은 부호(+-)로 인해서 상쇄될 가능성이 있다.
그러한 에러를 방지하기 위해 절댓값을 씌우거나 제곱을 할 수 있다.
1. MAE (Mean Absolute Error)
- MAE는 위와 같은 문제를 방지하기 위해 오차에 절댓값을 씌워 계산한 값들의 평균을 구하는 방법이다.
- 오차들의 부호로 인해서 오차가 서로 상쇄되는 문제를 해결할 수 있는 방식.
2. MSE (Mean Squared Error)
- MSE는 오차간의 부호 문제를 각 오차를 제곱하여 계산한 값들의 평균
- MSE의 경우 MAE와 같이 오차간의 부호 문제를 해결할 수는 있지만, 오차가 1미만인 값은 제곱을 통해서 더 작아지고, 1이상의 값은 제곱을 통해서 더 커지므로 이상값에 대해서 더 민감하다는 특징이 있음.
-실제 데이터와의 단위가 달라지므로 추가적인 해석이 필요함.
(100점 만점인 시험인데 현재 176점의 오차가 발생했다. 이는 추가해석이 필요)
3. RMSE (Root Mean Squared Error)
- MSE 값은 오차의 제곱을 구하므로 값이 커진다. 그래서 MSE에 루트를 씌운 RMSE값을 사용한다.
- MAE와 함께 가장 일반적으로 많이 쓰이는 회귀모델 성능 분석지표이다.
- 에러에 따른 손실이 기하 급수적으로 올라가는 상황에서 쓰기 적합하다.
4. R Square (R^2)
- R2 score라고도 부름
- R2 score의 경우 위 세가지 지표와는 달리 값이 1에 가까울 수록 성능이 좋다.
'ML > 지도학습' 카테고리의 다른 글
로지스틱 회귀(Logistic Regression) (0) | 2022.10.18 |
---|---|
퍼셉트론(단층) (0) | 2022.10.17 |
1.선형 회귀(Linear Regression) (0) | 2022.10.12 |