분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
2023 전력사용량 예측 AI 경진대회
CV전략
다른분들은 CV전략으로 어떤거 사용하고 계신가요?
시간을 셔플하고 랜덤으로 뽑은 걸 validation set으로 사용 중인데
CV-LB간 차이가 1.5 정도 나네요.
3일이나 일주일로 묶는게 나을까요?
아무래도 CV문제라기보다는 데이터 영역이 큰 것 같네요.
감사합니다.
저도 cv 방법은 여러개 써봤는데 뭘하든 2점정도 차이나네요 똥안님 말씀대로 데이터 특성상 어쩔수없는것 같습니다. 점수가 하도 다르게나와서 10fold로 나눈후에 10개 validation 평균값을 내도 1점대 후반이 나더군요
저는 훈련데이터 끝에 1주일을 검증용, 그 이전 전부를 훈련용으로 쓰고있습니다
1주일을 1폴드로 설정해서 폴드간 겹치지 않게 5-fold 정도로 했는데 괜찮은 것 같네요.
근데 CV전략보다 데이터 영역에서 영향을 크게 받는 것 같습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
저도 랜덤으로 뽑고 있습니다.