분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
CV전략
다른분들은 CV전략으로 어떤거 사용하고 계신가요?
시간을 셔플하고 랜덤으로 뽑은 걸 validation set으로 사용 중인데
CV-LB간 차이가 1.5 정도 나네요.
3일이나 일주일로 묶는게 나을까요?
아무래도 CV문제라기보다는 데이터 영역이 큰 것 같네요.
감사합니다.
저도 cv 방법은 여러개 써봤는데 뭘하든 2점정도 차이나네요 똥안님 말씀대로 데이터 특성상 어쩔수없는것 같습니다. 점수가 하도 다르게나와서 10fold로 나눈후에 10개 validation 평균값을 내도 1점대 후반이 나더군요
저는 훈련데이터 끝에 1주일을 검증용, 그 이전 전부를 훈련용으로 쓰고있습니다
1주일을 1폴드로 설정해서 폴드간 겹치지 않게 5-fold 정도로 했는데 괜찮은 것 같네요.
근데 CV전략보다 데이터 영역에서 영향을 크게 받는 것 같습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
저도 랜덤으로 뽑고 있습니다.