분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
도배 하자 유형 분류 AI 경진대회
validation시 weighted f1 score 문의
저 같은 경우는 8:2로 split을 하고 실험을 진행했습니다.
weighted f1 score가 0.88까지도 나오는거 같은데 실제로 테스트 파일을 올려보면 0.6 수준에서 머무는데
성능 지표를 weighted f1 score로 하는게 맞는건가요 ..?
오히려 weighted가 아니라 macro로 하게되면 얼추 0.62 ~ 0.7인 것으로 보아 weighted가 아니라 macro로 성능을 확신해야 될 것 같기도 하네요..
가장 높은 점수를 가진 데이터셋이 제출되기 때문에 결국 제출되는건 한 파일이라고 알고있는데...
오히려 그 파일을 만든 모델보다 다른 모델이 좀 더 점수가 잘 나와도 평가가 더 안좋게 되어서 그게 조금 걸리네요
채점받을 데이터를 2개까지 정할 수 있습니다~
알려주셔서 감사합니다 :)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
자신의 cv를 믿는게 좋습니다 리더보드는 전체 테스트 중 일부를 보여주는 것 이기 때문에 퍼블릭 점수에 fit해버리면 overfit이 됩니다. cv를 더욱 올려보세요