회귀 분석에서의 평가 지표-⑤R2 (결정 계수)-
평가 표시기
R2
r2 (결정 계수)선형 회귀 및 평가에 대해 배우기 시작할 때 볼 수있는 첫 번째 지표 일 것입니다. 선형성의 경우R2에 대한 계산 다음과 같습니다.
공식 요소를 분해 할 때
I.E.SSE(사각형의 잔여 합) ISrmse에서 평균 또는 제곱근을 찾지 못하는 제곱 오차입니다.
sst (평균 제곱)다음 정의입니다. 목적 변수의 평균 값입니다.
R2(후자는 전자의 차이점)만. 따라서이 표시기는 매우 간단한 모델과 비교할 때 성능을 보여줍니다. 어떤 경우에는R2계수는 음수입니다(예측 정확도가 대상 변수의 평균값보다 나쁜 경우).
포인트
- 매우 인기가 있습니다.MSE이후에 두 번째로 인기가 있습니다.
- 모델이 높을수록 높을수록 좋습니다. 범위는 -∞에서 시작합니다1|
- Dell 간의 비교는 쉽고 일관성이 있습니다. 예를 들어RMSE가있는 오류가 5 인 경우를 고려하면 "오류는5" 맥락 없이는 의미가 없습니다. 일일 온도를 예측하는 경우5정상 범위에서 오류 인 것 같습니다. 그러나 가족의 자녀 수를 예측하고 있다면+-5의 오류 좋다고 말할 수 없습니다. 평균적으로 어린이의 기대는입니다5당신은 또한 실수를하고 있습니다. 이러한 경우 원시 모델이 더 나은 정확도를 가질 것입니다. 하지만,R2정확도를 기본 모델과 비교하는 표시기이므로 모델간에 비교할 수있는 값입니다. 경험적으로 아래 표를 참조하십시오R2의 정확도를 확인할 수 있습니다. 컨텍스트없이 다른 모델에서 그러한 테이블을 만들 수는 없습니다.
R- 제곱 (R2)
평가 (등급)
<0.0
대상 변수의 평균값을 예측하는 것보다 최악
<0.1
나쁜
<0.2
약간 나쁜
<0.3
BAD ~ 정상
<0.5
정상
<0.7
정상에서 좋은
<0.9
좋은
0.9
아주 좋아!
- 정확도가 낮은 모델조차도 가치가 있습니다. "모든 모델이 잘못되었지만 일부는 유용하다"는 속담도 있습니다. 때로는 평균보다 약간 더 나은 모델이 사용하기에 가치가 있습니다. 예를 들어, 가장 최근의 날씨 정보에서3시간 후 풍속을 예측하면 이전ⅹ평균 시간보다 더 나은 예측은 비행기 이륙 결정과 같은 생명을 구할 수 있습니다.
반면,R2가 높기 때문에 사용 가치가 있다고 말할 수는 없습니다. 예를 들어, 마케팅 회사DM회사에1,000매일 $$ 결제를하고 제품에 대해 광고 된 다른 사용자에게 매일100,000다른 회사의 이메일을 보내기 위해 계약에 서명했다고 가정 해 봅시다. 이것100,000이메일 주소크레이지 슬롯 제품을 구매 한 사용자에 따라10,000당신은 달러 수입을 받게됩니다. 소득의 대부분이 이메일 사용자의 작은 부분에서 나온다고 가정 해 봅시다. 마케팅 회사500인 달러10,000보내는 또 다른 방법DM회사 선택은 비용을 줄일 수 있습니다(원래1,000달러100,000이것은 통근자).100,000모델은 사람들이 생성 한 총 수익을 예측하기 위해 만들어졌으며 구매 확률이 가장 높은 것으로 예상되었습니다10,000사람을위한 저렴한DM비용을 줄이기 위해 서비스로 전환했습니다. 이 모델은 1 인당 매출 예측이 상당히 높습니다R2모델(예 :0.9)그랬다고 가정 해 봅시다. 이 경우 구매 확률이 높았습니다.10,000100,000모든 사용자에게 연락하는 경우 예상 수익 이름90%(또는9,000/10,000Dollar). 완벽하지 않더라도 예측은 꽤 좋은 것으로 보입니다.그러나10% 수익(1,000Dollars)잃어버린 상태로 남아 있습니다DM서비스를 통해 전송되지 않음90,000사람의 예상 수익은500DollarDM비용 절감 효과. - 평균 오류에 대해 많이 모릅니다. 위에서 언급했듯이 이것은 기본 모델보다 얼마나 정확한 지 보여주는 것입니다. 따라서이 지표는 다음과 같습니다rmseyaMae, 오류를 확인할 수있는 다른 지표로 확인하는 것이 좋습니다.
- 무한히 부정적이므로 반 직관적입니다.
- MSErmse최적화 로직을 사용할 수 있습니다.
- 대부분의 제품/패키지에 최적화 로직이 있습니다.
어떤 상황크레이지 슬롯 그것을 사용해야합니까
이것은 대상 변수의 평균 값을 예측 값으로 사용하는 기본 모델에 대해 얼마나 정확한지 확인하려는 경우입니다. 이상적으로는 어떤 형태로 오류를 측정 할 수있는 다른 지표와 함께 사용해야합니다. 이 표시기는 완전히 다른 것을 예측하는 모델 간의 정확도를 비교하는 데 도움이됩니다.
정확성 및 R2
모델간에 비교할 수 있습니다R2를 사용하는 장점을 뒤집을 수 있습니다. 이것을 피하려면무인 AIatR2is Pearson 'sr (피어슨 제품 모이어 티 상관 계수)R2.MSE선형 회귀 최적화 로직의 경우 결과는 이전 섹션에서와 동일한 공식에서 계산됩니다. 다른 유형의 모델에서R2| 아마도 다른 공식 일 것입니다.
이 공식에서R2예측과 실제 측정 값이 변화하는 정도를 나타냅니다. 이 상태크레이지 슬롯R2is0~10예측과 실제 측정 사이에는 상관 관계가 없습니다.1완벽한 상관 관계가 있음을 의미합니다. 그러나 내부적으로MSE최적화 로직을 사용하는이 기술의 약점은 계산 오류를 완전히 무시하는 사양입니다. 먼저, 우리는 학위에 관계없이 실제 측정 및 예측 값을 근사화하는 데 중점을 둘 것입니다. 예를 들어 다음2모델이 동일합니다R2점수.
Blue 시리즈는 오류가 적지 만 두 모델 모두 대상 변수 변동을 예측하는 능력이 동일합니다. 지금까지 언급 했듯이이 단점은MSE의 최적화 로직으로 최소화되면 감소했습니다.
실험
R2를 사용한 검증 결과 다음과 같습니다.
득점자 (평가 지표) |
최종 테스트 점수 (최종 테스트 점수) |
gini |
0.9867 |
Mae |
1898 |
MAPE |
23.193 |
mer |
8.2822 |
MSE |
1.1824E+07 |
R2 |
0.96271 |
rmse |
3438.5 |
rmsle |
nan |
rmspe |
15894 |
smape |
15.666 |
0.96271R2all실험| 가장 높은 값이며 예측과 실제 측정 값을 비교MAPE의 경우와 유사합니다.
원본 제목
(공식) h2o.ai 크레이지 슬롯
회귀 메트릭 '거드
Marios Michailidis