서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
PyCaret으로 test데이터 정확도 구하는 방법
지금까지 pycaret를 사용하면서 느낀건데 다 train데이터의 정확도만 구할 수 있는 것 같습니다., 혹시 test데이터의 정확도는 구하는 방법이 있을까요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
없는거 같습니다.. TEST 데이터라는건 사실상 관측되지 않은 데이터 입니다. 물론, 대회에서 TEST데이터 셋이 존재하지만, 이건 이미 관측된 data set 일부를 추출하여 공개하지 않은 ( 인위적으로 관측되지 않았다라 가정) 데이터 입니다.
가장 일반적인 방법은, 주어진 train 데이터중 validation dataset을 만들고, validation은 학습에 사용하지 않고 test set처럼 사용해야 하겠죠..
파이캐럿도 주어진 train dataset을 이용하여 validation set을 만들어 학습에 사용하지 않고, 평가에만 사용합니다.