데이스쿨 할인 리턴즈
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
데이콘 x BDA 제 2회 학습자 수료 예측 AI 경진대회
모두 1로 예측시에 f1 score 0.388의 의미?
제미나이 물어보니
전부 1로 예측시 양성 비율
p = f1/(2-f1) 이되어 test데이터의 실제 양성 비율 p = 24% 수준입니다.
이 경우 f1스코어 0.388 이하의 분류모델은 무의미한 예측이라고 할수 있나요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
이번대회에서 cv상의 f1score는 사실 무의미하다고 생각됩니다.
1회 bda학습수료 예측때도 모든 데이터가 1로 예측되는경우가 많았습니다. 이를 조금이라도? 개선하기 위해선 임계값을 0.5가 아닌값으로 낮춰본다던지 하는방법이 도움이 될 것 같구요.
다만 이방법이 실제 LB까진 먹혀도 private까진 장담하진 못할거 같습니다 ㅎㅎ.. 데이터셋도 그리 정제된편이 아니기도하구요