회귀 분석의 평가 지표-②mae-
평가 표시기
Mae
평균 절대 오류(MAE)또한 다음 방정식으로 표현 된 인기있는 회귀 지표입니다.
각 행의 실제 측정 값에서 예측 값을 음수로 만들고 항상 긍정적 이도록 절대 값을 취하십시오. 그런 다음 모든 절대 오류의 평균을 찾으십시오.
포인트
- Mae또한 인기있는 지표입니다. 그런데,"Mae및rmse?(사용 사례에 분명히 의존합니다).
- 값이 작을수록 값이 좋아집니다. 또한 값은 0보다 크거나 동일합니다.
- 이 표시기의 모든 오류는 무게가 동일합니다.2오류는1오류2두 배나 나쁩니다.
- 이상치에 취약한(그러나RMSE).
- 최적화는 쉽지 않습니다. 실제 측정 값과 예측 값 일치 및 오류가 0 일 때Mae차분 할 수 없으며 대상 변수의 분포에 따라 다른 근사치입니다.
- 대부분의 주요 알고리즘은Mae의 최적화 논리가 있지만Mae를 최적화하기가 어렵 기 때문에 항상 최고는 아닙니다. 예를 들어, 최근Kaggle경쟁을 알고 있다면 일부 알고리즘을 사용하십시오MSE의 최적화 논리가 더 좋습니다Mae의 최적화를 알고 있습니다 좋은 결과입니다.
어떤 상황에서 그것을 사용해야합니까
각 오류가 해당 척도와 비슷한 중요성을 가진 경우 효과적입니다.200달러 오류100달러 오류2이것은 종종 두 배의 영향을 미치는 재무와 같은 영역에 적용됩니다. 이것들은 논리적이지만 인간은 특정 오류에 크게 강조하지 않습니다(또는 강조)for,rmse또한 인기가 있습니다.
실험
Mae| 평가 함수와 동일하게 설정실험다음과 같습니다.
득점자 (평가 표시기) |
최종 테스트 점수 |
gini | 0.98558 |
Mae | 1883.8 |
MAPE | 17.182 |
mer | 8.1498 |
MSE | 1.3847E+07 |
R2 | 0.95734 |
RMSE | 3721.1 |
rmsle | NAN |
rmspe | 6875.9 |
smape | 13.851 |
보시다시피rmseMaei2,0761,883이제 출시되었습니다. 한편, 이번에는rmsei3,658.83721로 악화되고 있습니다. 이는 처음에 언급 된 하나의 표시기가있는 좋은 모델이 반드시 모든 지표에 대한 정확도를 제공하지는 않으므로 모든 정확도 지표를 이해하고 분석하는 사용 사례에 적합한 것을 선택하는 것이 중요합니다.
Storeid:39/부서id:3의 시리즈 다음과 같습니다.
빨간색으로 둘러싸인 피크rmse로 데이터가 최적화 된 경우와 유의 한 차이가 있지만 각 데이터 간의 오차는 더 작습니다.Mae비교적 작은 샘플 값의 오류가 적절한 지 확인하기 위해이 정점에서 오류를 희생했습니다. 분명히, 다른 상점/부서 데이터에서 동일한 최적화가 이루어지고 다른 표시기 도이 그래프에서 다른 결과를 생성한다는 것을 알 수 있습니다.
원본 제목
(공식) h2o.ai 크레이지 크레이지 슬롯
회귀 메트릭 '거드
Marios Michailidis