2023 전력사용량 예측 AI 경진대회

CV전략

2023.08.03 17:57 1,482 조회

다른분들은 CV전략으로 어떤거 사용하고 계신가요?

시간을 셔플하고 랜덤으로 뽑은 걸 validation set으로 사용 중인데

CV-LB간 차이가 1.5 정도 나네요.

3일이나 일주일로 묶는게 나을까요?

로그인이 필요합니다
0 / 1000
Oak_tree
2023.08.03 22:50

저도 랜덤으로 뽑고 있습니다. 

똥안
2023.08.04 20:46

아무래도 CV문제라기보다는 데이터 영역이 큰 것 같네요.
감사합니다.

Oak_tree
2023.08.05 10:00

저도 cv 방법은 여러개 써봤는데 뭘하든 2점정도 차이나네요 똥안님 말씀대로 데이터 특성상 어쩔수없는것 같습니다. 점수가 하도 다르게나와서 10fold로 나눈후에 10개 validation 평균값을 내도 1점대 후반이 나더군요

쿠마리코지카후원회동남지부장
2023.08.04 18:02

저는 훈련데이터 끝에 1주일을 검증용, 그 이전 전부를 훈련용으로 쓰고있습니다

똥안
2023.08.04 20:49

1주일을 1폴드로 설정해서 폴드간 겹치지 않게 5-fold 정도로 했는데 괜찮은 것 같네요.
근데 CV전략보다 데이터 영역에서 영향을 크게 받는 것 같습니다.