상점 신용카드 매출 예측 경진대회

알고리즘 | 정형 | 회귀 | 매출 | 회귀 | MAE

  • moneyIcon 상금 : 200만원
  • 1,515명 마감

 

metric이 왜 MAE인지에 대한 설명을 조금 들을 수 있을까요??

2019.07.11 16:33 4,964 조회

metric이 왜 MAE인지에 대한 설명을 조금 들을 수 있을까요??

로그인이 필요합니다
0 / 1000
송근구ㅡㄴ
2022.02.14 16:20

안녕하세요 세원님,

저희는 대회 기획 단계에서 평가산식을 RMSE로 할지 MAE로 할 지 고민을 했습니다.

 

잘 알다시피, MAE는 에러에 절댓값을 취하기 때문에, 에러의 크기 그대로 반영됩니다.

그러므로 예측 결과물의 에러가 10이 나온 것이 5로 나온 것보다, 정확히 2배가 나쁜 도메인에서 쓰기 적합한 산식이죠.

즉, 에러에 따른 손실이 선형적으로 올라가는 상황에서 쓰기 적합합니다.

 

그러나, RMSE는 에러에 제곱을 하기 때문에 에러가 크면 클수록 그에 따른 가중치가 높이 반영됩니다(물론 최종 결과물에 루트를 씌우긴 하지만 여전히 높게 반영됩니다).

그러므로 예측 결과물의 에러가 10이 나온 것이 5로 나온 것보다, 정확히 2^2(4)배가 나쁜 도메인에서 쓰기 적합한 산식입니다.

즉, 에러에 따른 손실이 기하 급수적으로 올라가는 상황에서 쓰기 적합합니다.

 

저희는 이 점에 착안해, 현재 저희의 스폰서인 펀다가 왜 이 모델을 원하는지를 생각해보았습니다.


펀다는 각 상점별로 얼만큼의 금액을 대출해줄지를 결정하기 위해 매출 예측 모델을 원합니다.


 


만약 어떤 상점 A와 B가 펀다에게 대출을 요청한 상황에서, 펀다가 미래 3개월간 A 상점은 2000만원의 매출을, B 상점은 3000만원의 매출을 올릴 것이라고 예측했다고 가정합시다.


그런데, 실제로 상점 A는 1500만원, B는 1800만원의 매출을 냈습니다.


이 상황에서 펀다가 손해보는 금액은 ((2000-1500)+(3000-1800))이지 (((2000-1500)**2+(3000-1800)**2)**(1/2))이 아닙니다


(물론 이자율 등과 같은 복잡한 요